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全 国 高 等 学 校 五 年 制 本 科 临 床 医学 专业 
第 八 轮 


全 国 高 等 学 校 五 年 制 本 科 临 床 医学 专业 卫生 部 规划 教材 自 1978 年 第 一 轮 出 版 至 今 已 有 
35 年 的 历史 。 几 十 年 来 ,在 教育 部 .卫生 部 的 领导 和 支持 下 ,以 裘 法 祖 、 吴 阶 平 . 吴 备 超 . 陈 当 珠 
等 院士 为 代表 的 我 国 几 代 德 高 望 重 、 有 丰富 的 临床 和 教学 经 验 、 有 高 度 责任 感 和 敬业 精神 的 国 
内 外 著名 院士 专家、 医学 家 ,教育 家 参与 了 本 套 教 材 的 创建 和 每 一 轮 教材 的 修订 工作 ,使 我 国 
的 五 年 制 本 科 临 床 医学 教材 从 无 到 有 ,从 少 到 多 ,从 多 到 精 ,不 断 丰 富 .完善 与 创新 ,形成 了 课程 
门类 齐全 ,学 科 系统 优化 .内容 衔 接合 理 、 结 构 体 系 科学 的 由 规划 教材 ,配套 教材 .配套 光盘 、 数 
字 出 版 .网络 增值 服务 组 成 的 立体 化 教材 格局 。 这 套 教材 为 我 国 千 百 万 医学 生 的 培养 和 成 才 提 
t 了 根本 保障 ,为 我 国 培养 了 一 代 又 一 代 高 水 平 ,高 素质 的 合格 医学 人 才 ,为 推动 我 国医 疗 卫生 
基业 的 改革 和 发 展 做 出 了 历史 性 巨大 贡献 ,并 通过 教材 的 创新 建设 和 高 质量 发 展 ,推动 了 我 国 
;等 医学 本 科教 育 的 改革 和 发 展 ,促进 了 我 国医 药学 相关 学 科 或 领域 的 教材 建设 和 教育 发 展 ， 
E 出 了 一 条 适合 中 国医 药学 教育 和 卫生 事业 发 展 实际 的 具有 中 国 特 色 医 药学 教材 建设 和 发 展 
的 道路 ,创建 了 中 国 特色 医药 学 教育 教材 建设 模式 。 老 一 辈 医学 教育 家 和 科学 家 们 亲切 地 称 这 
套 教材 是 中 国医 学 教育 的 “干细胞 "教材 。 
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本 套 第 八 轮 教材 修订 启动 之 时 , 正 是 全 球 医学 教育 百年 反思 之 际 ,更 是 我 国医 疗 卫生 体制 
改革 和 医学 教育 改革 全 方位 深入 推进 之 时 ,教育 部 .卫生 部 共同 召开 了 全 国医 学 教育 改革 工作 
会 议 ,启动 了 “543" 为 主体 的 临床 医学 教育 综合 改革 ,形成 了 以 医改 推动 教改 ,教改 服务 医改 的 
历史 发 展 格局 。 人 民 卫 生出 版 社 和 全 国 高 等 医药 教材 建设 研究 会 紧 紧 抓 住 医学 教育 综合 改革 
的 历史 发 展 机 遇 期 ,以 全 国 高 等 学 校 五 年 制 本 科 临 床 医学 专业 第 八 轮 规划 教材 全 面 启动 为 下 
机 ,以 规划 教材 创新 建设 ,全 面 推进 国家 级 规划 教材 建设 工作 ,服务 于 医改 和 教改 。 


























第 八 轮 教 材 的 修订 原则 是 积极 贯彻 落实 教育 部 .卫生 部 关于 实施 临床 医学 教育 综合 改革 的 
意见 ,努力 优化 人 才 培 养 结构 ,坚持 以 需求 为 导向 ,构建 发 展 以 “5+3?” 模式 为 主体 的 临床 医学 人 
才 培 养 体系 ;改革 课程 体系 .教学 内 容 .教学 方法 和 评价 考核 办 法 ;将 医德 教育 贯穿 于 医学 教育 
的 全 过 程 ,强化 临床 实践 教学 ,采取 多 种 措施 ,切实 落实 好 * 早 临床 ,多 临床 .反复 临床 " 的 要 求 ， 
提高 医学 生 的 临床 实践 能 力 。 








在 全 国医 学 教育 综合 改革 精神 鼓舞 下 和 老 一 非 医学 家 奉献 精神 的 感召 下 ,全 国 一 大 批 临床 
教学 科研 .医疗 第 一 线 的 中 青年 专家 ,学 者 .教授 继承 和 发 扬 了 老 一 辈 的 优秀 传统 ,以 严谨 治学 
的 科学 态度 和 无 私 奉献 的 敬业 精神 ,积极 参与 第 八 轮 教材 的 修订 和 建设 工作 ,紧密 结合 五 年 制 
临床 医学 专业 培养 目标 .高 等 医学 教育 教学 改革 的 需要 和 医药 卫生 行业 人 才 的 需求 ,借鉴 国内 
外 医学 教育 教学 的 经 验 和 成 果 , 不 断 创新 编写 思路 和 编写 模式 ,不 断 完 善 表现 形式 和 内 容 ,不 断 
提升 编写 水 平和 质量 ,已 逐渐 将 每 一 部 教材 打造 成 了 学 科 精 品 教材 ,使 第 八 轮 全 套 教材 更 加 成 
熟 .完善 和 科学 ,从 而 构建 了 适合 “5+3” 为 主体 的 医学 教育 综合 改革 需要 和 卓越 临床 医师 培养 需 
求 的 教材 体系 ,推动 了 适合 中 国 国情 的 五 年 制 本 科 临 床 医学 专业 课程 体系 的 建设 














本 次 修订 和 编写 特点 如 下 : 


1. 教材 编写 修订 工作 是 在 教育 部 .卫生 部 的 领导 和 支持 下 ,按照 “5+3” 为 主体 的 临床 医学 
教育 综合 改革 的 时 间 表 、 路 线 图 和 施工 图 进行 顶层 设计 ,由 全 国 高 等 医药 教材 建设 研究 会 规划 ， 
全 国 临床 医学 专业 教材 评审 委员 会 审定 ,院士 .专家 把 关 , 全 国 各 医学 院 校 知名 专家 教授 编写 ， 
人 民 卫 生出 版 社 高 质量 精品 出 版 。 





2. 教材 编写 修订 工作 是 根据 教育 部 培养 目标 .卫生 部 行业 要 求 ,社会 用 人 需求 ,在 全 国 进行 
科学 调研 的 基础 上 ,借鉴 国内 外 医学 人 才 培养 模式 和 教材 建设 经 验 , 充 分 研究 论证 本 专业 人 才 
素质 要 求学 科 体系 构成 .课程 体系 设计 和 教材 体系 规划 后 ,科学 进行 的 。 

















3. 在 全 国 广泛 深入 调研 的 基础 上 ,总 结 和 汲取 了 前 七 轮 教材 的 编写 经 验 和 成 果 , 尤 其 是 对 
一 些 不 足 之 处 进行 了 大 量 的 修改 和 完善 ,并 在 充分 体现 科学 性 .权威 性 的 基础 上 ,更 考虑 其 全 国 
范围 的 代表 性 和 适用 性 。 





























4 教材 编写 修订 工作 着 力 进行 课程 体系 的 优化 改革 和 教材 体系 的 建设 创新 一 一 科学 整合 
课程 淡化 学 科 意识 .实现 整体 优化 ,注重 系统 科学 ,保证 点 面 结合 。 继 续 坚持 “三 基 ` 五 性 、 三 特 
定 "的 教材 编写 原则 ,以 确保 教材 质量 。 











5 为 配合 教学 改革 的 需要 减轻 学 生 负 担 和 体现 “干细胞 " 教材 特色 ,全 套 教材 精炼 文字 、 
压缩 字数 ,注重 提高 内 容 质量 ,并 根据 学 科 需 要 ,采用 大 16 开国 际 开本 、 双 色 或 彩色 印刷 ,以 提 
高 印 装 质量 和 可 读 性 。 同 时 ,在 每 一 页 都 增加 了 留 白 , 便 于 学 生 记录 和 标记 书 中 重点 知识 。 




















6 为 满足 教学 资源 的 多 样 化 需求 ,实现 教材 系列 化 ,立体 化 和 数字 化 建设 ,大 部 分 教材 配 有 
配套 教材 和 数字 出 版 的 教学 资料 ,并 实现 了 全 套 教 材 的 网 络 增值 服务 ,方便 老师 教学 和 学 生 自 
主 学 习 ,实现 了 数字 化 资源 共享 。 


第 八 轮 教材 共有 53 种 ,其 中 新 增 2 种 , 即 《 医 患 沟通 》 和 《肿瘤 学 概论 六 更 名 1 种 , 即 《急诊 
医学 更 名 为 (急诊 与 灾难 医学 ,合并 2 种 ， 即 《 生 物化 学 》 与 4 医学 分 子 生物 学 》 合 并 为 《生物 
化 学 与 分 子 生物 学 》。 全 套 教材 均 为 “十 二 五 ”普通 高 等 教育 本 科 国 家 级 规划 教材 ( 除 《肿瘤 学 
概论 站 ) 和 卫生 部 “十 二 五 ”规划 教材 ,于 2013 年 6 月 全 部 出 版 发 行 。 


本 套 教 材 是 在 我 国医 学 教育 综合 改革 ,构建 “543" 为 主体 的 临床 医学 人 才 培养 体系 背景 下 
组 织 编号 的 , 硕 望 全 国 各 广大 院 校 在 使 用 过 程 中 能 够 多 提供 宝贵 意见 ,反馈 使 用 信息 ,以 逐步 修 
改 和 完善 教材 内 容 ,提高 教材 质量 ,为 第 九 轮 教材 的 修订 十 作 建言 献策 。 
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高 水 平 .高 质量 的 医学 教育 既是 办 好 人 民 满 意 教育 的 重要 组 成 部 分 ,也 是 医疗 卫生 事业 改 
革 发 展 的 重要 支撑 。 随 着 我 国医 药 卫 生体 制 改革 的 不 断 深入 ,对 高 等 医学 教育 改革 也 提出 了 更 
高 的 要 求 。 如 何 培养 适应 国家 需要 、 人 民 满 意 的 高 质量 、 高 水 平 医 学 人 才 是 当前 医学 教育 的 首 
要 任务 。 为 此 ,在 “十 二 五 ”开局 之 年 ,教育 部 和 卫生 部 共同 组 织 实施 了 医学 教育 综合 改革 。 


医学 教育 综合 改革 要 求 我 们 深入 贯彻 落实 教育 规划 纲要 和 医药 卫生 体制 改革 的 意见 ,遵循 
医学 教育 规律 ,以 改革 创新 为 动力 ,着 力 于 医学 教育 发 展 与 医药 卫生 事业 发 展 的 紧密 结合 ,着力 
于 人 才 培 养 模 式 和 体制 .机制 的 重点 突破 ,着 力 于 医学 生 职业 道德 和 临床 实践 能 力 的 显著 提升 ， 
着 力 于 医学 教育 质量 保障 体系 的 明显 加 强 ,从 而 全 面 提高 医学 人 才 培 养 质 量 , 为 发 展 医药 卫生 
事业 和 提高 人 民 健康 水 平 提供 坚实 的 人 才 保 障 。 








教材 建设 在 提高 人 才 培 养 质 量 中 发 挥 着 重要 的 基础 性 作用 ,对 此 教育 部 一 直 高 度 重视 ,要 
求 以 教材 建设 为 抓 手 ,推动 医学 课程 和 教学 方法 改革 。 一 本 好 的 教材 ,给 医学 生 以 正确 的 引导 ， 
给 临床 医生 以 正确 的 指导 。 人 民 卫 生出 版 社 作为 国家 级 优秀 出 版 单位 ,承担 了 大 量 教材 的 规划 
和 出 版 工作 ,形成 了 课程 种 类 齐全 学 科 体系 合理 、 配 套 服务 全 面 的 教材 出 版 模式 。 尤 其 是 在 以 
吴阶平 .类 法 祖 , 吴 孟 超 、 陈 当 珠 等 院士 为 代表 的 老 一 非 医 学 大 家 的 付出 和 带领 下 ,在 一 大 批 医 
学 教育 精英 的 努力 和 参与 下 ,其 出 版 的 五 年 制 本 科 临 床 医学 专业 规划 教材 为 我 国医 学 界 培养 了 
一 代 又 一 代 优秀 的 医药 学 人 才 ,为 推动 我 国医 疗 卫生 事业 的 改革 和 发 展 做 出 了 巨大 的 历史 页 献 。 


























此 次 第 八 轮 五 年 制 本 科 临 床 医学 专业 规划 教材 的 修订 工作 是 在 贯彻 党 的 十 八大 关于 “深化 
教育 领域 综合 改革 "精神 的 背景 下 ,在 落实 卫生 部 教育 部 联合 下 发 的 《关于 实施 临床 医学 教育 
综合 改革 的 若干 意见 的 村 础 上 启动 的 。 修 订 工作 贯穿 了 医学 教育 综合 改革 的 要 求 ,特别 是 注 
重 将 医德 教育 贯穿 于 医学 教育 的 全 过 程 ,增加 了 《 医 患 沟通 》 一 书 ,同时 强化 临床 实践 教学 ,配套 
编写 了 相关 的 实践 指导 ,以 提高 医学 生 的 临床 实践 能 力 。 


我 们 相信 ,在 教育 .卫生 系统 的 通力 合作 下 ,在 广大 医学 教育 工作 者 的 大 力 支持 和 参与 下 ， 
第 八 轮 五 年 制 本 科 临 床 医学 专业 规划 教材 的 修订 出 版 对 推动 医学 教育 综合 改革 ,提高 医学 人 才 
培养 质量 将 产生 积极 的 推动 作用 。 





教育 部 部 长 助理 


放 甸 有 有 
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王家 良 

男 , 1933 年 9 月 出 生 于 湖北 省 宜 都 市 。1960 年 毕业 于 原 四 川 医学 
院 医 学 系 ( 现 四 川 大 学 华西 临床 医学 院 ), 1982 年 留学 加 拿 大 McMaster 
大 学 , 获 理 学 硕士 学 位 。 华 西医 院内 科 及 临床 流行 病 学 教授 , 曾 任 大 内 
科 副 主任 和 临床 流行 病 学 教研 室 及 国际 临床 流行 病 学 网 (INCLEN ) 二 
级 资源 与 培训 中 心 主任 。 系 我 国 临床 流行 病 学 及 循 证 医学 的 主要 创始 
人 和 葛 基 者 。 首 编 与 出 版 了 我 国 《临床 流行 病 学 ) 和 《 循 证 医学 专著 ; 
主编 了 国家 重点 医学 教材 《临床 流行 病 学 和 《 循 证 医学 (长 学 制 、 五 年 
制 ), 还 承担 了 主 审 长 学 制 教材 《临床 流行 病 学 的 任务 等 。 先 后 获 国家 
级 一 等 教学 成 果 奖 、 教 育 部 二 等 优秀 教材 奖 、 全 国医 学 教材 一 等 奖 以 及 
全 国 优秀 图 书 二 等 奖 , 为 我 国 临床 流行 病 学 和 循 证 医学 的 学 科 系 统 理 
论 及 教材 建设 葛 定 了 良好 的 基础 。 

在 国际 上 先后 被 聘 为 国际 临床 流行 病 学 网 (INCLEN ) 董 事 会 董事 及 
委员 会 委员 , 获得 了 INCLEN 特别 贡献 奖 。 在 国内 先后 倡议 、 发 起 和 组 
建 了 中 国 临 床 流行 病 学 网 (ChinaCLEN ) 和 中 华 医学 会 临床 流行 病 专业 
委员 会 并 被 选 为 首 任 主任 委员 、 荣 誉 主任 委员 ; 先后 获 国家 人 事 部 授予 
的 “国家 优秀 留学 归 国 人 员 ”、 卫 生 部 授予 的 “有 突出 贡献 的 中 青年 专家 ” 
等 荣誉 称号 , 以 及 国务 院 首 批 “ 有 突出 贡献 专家 津贴 "等 。 





























王 滨 宵 


男 , 1942 年 6 月 出 生 于 黑龙 江 省 哈尔滨 市 。 现 为 哈尔滨 医科 大 学 
公共 卫生 学 院 流行 病 学 教授 .博士 生 导师 , 黑龙 江 省 重点 学 科 流行 病 学 
学 科 带头 人 。 曾 先后 留学 于 加 拿 大 多 伦 多 大 学 .加拿大 卡尔 加 里 大 学 
和 美国 贝勒 医学 院 。 曾 兼任 第 四 届 国 务 院 学 位 委员 会 学 科 评 议 组 成 员 、 
省 学 位 委员 会 委员 中 华 预防 医学 会 流行 病 学 会 副 主任 委员 、 中 华 医学 
会 临床 流行 病 学 会 副 主任 委员 、 中 华 流 行 病 学 杂志 副 总 编辑 .全国 继续 
医学 教育 委员 会 学 科 组 成 员 、 江 苏 大 学 客座 教授 .山东 大 学 兼职 教授 、 
安徽 医科 大 学 名 誉 教授 ,加拿大 多 伦 多 大 学 客座 教授 。 

从 事 教 学 工作 46 年 。 享受 国务 院 政府 特殊 津贴 。 曾 先后 荣获 全 国 
优秀 科技 工作 者 , 黑龙 江 省 第 三 届 高 4 教学 名 师 奖 , 中 华 预防 医学 
会 “公共 卫生 与 预防 医学 发 展 贡献 奖 ", 中 华 预 防 医学 会 流行 病 学 分 会 
“中 国 流行 病 学 杰出 贡献 奖 ”, 黑龙 江 省 “留学 人 员 报 国 奖 ", 哈尔滨 医科 
大 学 教学 名 师 和 哈尔滨 医科 大 学 十 佳 中 年 教师 等 多 项 奖励 。 先 后 主持 
承担 国家 自然 科学 基金 项 目 .CMB 项 目 .国际 协作 项 目 及 卫生 部 、 省 科 
委 重 大 项 目 、 省 自然 金 项 目 等 多 项 科研 项 目 。 曾 先后 获 卫 生 部 、 
省 政府 、 省 卫生 厅 、 省 教委 科技 进步 奖 多 项 。 作 为 主编 . 副 主编 . 编 委 出 
版 有 关 专 著 、 教 材 60 余部 , 于 国内 外 杂志 公开 发 论文 170 余 篇 。 
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刘 续 宝 


男 , 1961 年 3 月 出 生 于 四 川 省 成 都 市 。1983 年 毕业 于 华西 医科 大 
学 ( 现 合并 于 四 川 大 学 ), 获 医学 学 士 学 位 ,后 留 校 从 事 外 科 临 床 工作 。 
相继 在 华西 医科 大 学 完成 研究 生 学 习 , 获 医学 硕士 和 博士 学 位 。20 世 
纪 90 年 代 在 菲律宾 大 学 医学 院 完成 临床 流行 病 学 理学 硕士 学 位 学 习 和 
美国 印第安 纳 大 学 医学 院 的 博士 后 研究 。 

现 为 四 川 大 学 华西 医院 肝胆 胰 外 科 和 临床 流行 病 学 教研 室 教 授 、 博 
士 研究 生 导师 。 兼 任 中 国外 科 医 师 协 会 第 一 届 和 第 二 届 常 务 委员 中华 
外 科学 会 胰腺 学 组 委员 .中国 抗 癌 协 会 胰腺 癌 专 业 委员 会 副 主任 委员 、 
中 华 临床 流行 病 学 会 第 5 届 和 第 6 届 副 主任 委员 、 第 7 届 常 委 , 并 为 四 
川 省 医学 会 临床 流行 病 学 专业 委员 会 主任 委员 、 四川 省 抗 癌 协会 胰腺 癌 
和 胃癌 专业 委员 会 主任 委员 , 兼 《中 华 外 科 杂 志 》 和 《中 华 内 分 湾 外 科 杂 
志 》《 中 华 胰腺 病 杂 志 》《 中 国 普 外 基础 与 临床 杂志 》《 中 国 普通 外 
志 》 等 多 个 专业 杂志 编 委 。 主 要 从 事 普 通 外 科 和 临床 流行 病 学 的 临床 工 
作 和 教学 ,侧重 于 胰腺 外 科 疾 病 的 临床 和 相关 基础 研究 , 在 国内 、 外 杂 
志 上 发 表 了 100 余 篇 研究 论文 , 主编 专著 《急性 胰腺 炎 》 和 《腹部 外 科 手 
术 要 点 及 围 手术 期 处 理 》 副 主编 第 3 版 “十 一 五 ”规划 教材 《临床 流行 病 
学 》 及 参 编 (胰腺 疾病 》 和 K《 临 床 流行 病 学 与 循 证 医学 等 多 部 专车 和 教材 。 













































王 素 立 


女 ,1957 年 8 月 出 生 于 山西 省 太原 市 。 现 任 山西 医科 大 学 公共 卫 
= 学 院 主 持 工 作 副 院 长 , 教研室 主任 ,教授 ,博士 生 导 师 。 山 西 省 重点 
学 科 流 行 病 与 卫生 统计 学 学 科 带 头 人 , 国际 流行 病 学 学 会 会 员 , 中 华 医 
学 会 临床 流行 病 学 分 会 委员 , 山西 预防 医学 会 副 会 长 , 中 共 山 西 省 委 联 
系 的 高 级 专家 所 

甸 床 流行 病 学 及 流行 病 学 教学 科研 工作 30 年 , 主要 研究 方向 
为 传染 病 流行 病 学 及 环境 流行 病 学 , 主持 5 项 国家 自然 科学 
科技 部 重大 专项 子 课 题 , 多 项 教育 部 及 其 他 省 部 级 科研 基金 , 国内 外 其 
状 发 表 论文 百 余 篇 , 获 多 项 科技 奖 。 乙 型 肝炎 病毒 宫 内 传播 机 制 等 人 研 
究 工 作成 绩 显 著 。 培 养 硕 士 研 究 生 ,博士 研究 生 及 博士 后 90 余 名 。 成 
功 申报 流行 病 与 卫生 统计 学 博士 学 位 授权 点 及 公共 卫生 与 预防 医学 博 
上 点 。 主 编 及 出 版 普通 高 等 教育 “十 一 二 "国家 级 规划 教材 《流行 病 学 》， 
并 已 获 批 主编 普通 高 等 教育 “十 二 五 " 国家 级 规划 教材 《流行 病 学 》 获 
中 国 流行 病 学 优秀 奖 , 获 山 西 省 教学 成 果 二 等 奖 , 被 山西 省 教育 厅 及 山 
西 省 政府 授予 山西 省 普 i 校 教 学 名 师 , 流行 病 学 山西 省 本 科教 
育 精 品 课程 带头 人 ,临床 流行 病 学 山西 省 研究 后 教育 精品 课程 带头 人 ， 
流行 病 与 卫生 统计 学 研究 生 教育 优秀 导师 团队 带头 人 
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乳业 看 


男 , 博 士 , 1961 年 10 月 出 生 于 安徽 省 寿 县 。 现 为 安徽 医科 大 学 教 
务 处 处 长 , 循 证 医药 学 中 心 主 任 , 公共 卫生 学 院 流行 病 SD 系 
教授 , 博士 研究 生 导 师 , 安徽 省 学 术 和 技术 带头 人 , 省 级 重点 学 科 、 国 家 
级 精品 课程 《流行 病 学 》 学 术 带 头 人 之 一 。 

近年 获 省 级 科技 进步 三 等 奖 1 项 , 国家 级 教学 研究 成 果 二 等 奖 , 省 
级 教学 研究 成 果 一 等 奖 、 二 等 奖 各 1 项 ; 在 国内 外 发 表 学 术 论 文 150 余 
篇 ; 主编 、 副 主编 、 参 编 出 版 学 术 著作 或 教材 16 本 。 获 评 2007 年 安徽 
省 优秀 教师 , 2010 年 安徽 省 优秀 教学 管理 工作 者 。 











时 景 屿 


男 ,教授 ,博士 研究 生 导师 。1956 年 11 月 30 日 出 生 于 辽宁 省 凤 城 
市 。 现 任 中 国医 科大 学 附属 第 一 医院 临床 流行 病 学 与 循 证 医学 教研 室 
主任 , 中 华 医学 会 临床 流行 病 学 分 会 常委 , 辽宁 省 临床 流行 病 学 与 循 证 
医学 分 会 主任 委员 等 职 。 任 《中 国 实用 内 科 杂 志 ) 常 务 编 委 ,《 中 华 流行 
杂志 ) 等 编 委 , Biomedical and Environmental Sciences、Gene 《中 华 

学 杂志 》 等 审 稿 专家 。 

作为 副 主编 及 编 委 参加 了 十 几 部 各 类 教材 的 编写 , 承担 了 十 几 项 
国家 、 省 部 级 研究 课题 ,作为 负责 人 及 主要 参加 者 , 获得 国家 科技 进步 
二 等 奖 1 项 , 省 级 科技 进步 奖 4 项。 近 些 年 在 国内 外 杂志 发 表 论文 150 
多 篇 。 














临床 流行 病 学 是 一 门 新 兴 的 、 前 沿 性 的 、 多 学 科 交 叉 的 临床 研究 方法 学 。 其 学 科 特 点 是 突 
出 临床 , 传教 医学 生 以 群体 观点 对 疾病 发 生 发展、 诊断 、 防 治 及 预后 等 方面 进行 临床 研究 的 基 
本 理论 .基本 知识 和 基本 方法 , 使 临床 医学 生 从 个 体 患 者 的 特点 , 扩大 到 疾病 的 群体 共性 规律 
的 认识 , 旨 在 培养 医学 生 创新 性 思维 和 临床 研究 能 力 。 





本 教材 第 1 版 .第 2 版 .第 3 版 问世 后 ,接受 了 全 国 高 等 医学 教育 和 医学 继续 教育 社会 实践 
的 考验 , 相继 荣获 “教育 部 优秀 教材 二 等 奖 (2002)” 和 “全 国 高 等 医药 优秀 教材 一 等 奖 (2005， 
表明 了 本 教材 是 一 本 深 受 欢迎 的 优秀 教材 。 
根据 “ 早 临 床 、 多 临床 .反复 临床 " 的 临床 医学 教育 改革 精神 , 在 这 次 第 4 版 的 修订 中 , 进 一 
临床 前 移 , 扩 增 了 循 证 医学 的 内 容 , 将 教材 更 名 为 《临床 流行 病 学 与 循 证 医学 》 同时 结合 
本 学 科 的 国际 进展 和 我 国 高 等 医学 教育 的 实际 , 充分 发 挥 了 新 的 编 委 会 的 集体 智慧 , 对 第 4 版 
的 内 容 作 了 一 些 创 意 性 修订 , 本 版 次 教材 共 设置 16 章 , 其 中 : 








向 























1 鉴于 第 3 版 教材 评价 及 反馈 意见 均 良好 , 在 坚持 “三 基 "、“ 五 性 "的 基础 上 ,将 继续 保留 
第 3 版 教材 原 有 的 11 章 , 其 中 部 分 章节 进行 了 更 名 : @D 原 第 四 章 更 名 为 “医学 研究 证 据 的 检索 
与 收集 "; 回 原 第 五 章 更 名 为 “医学 研究 文献 的 评阅 "; @@ 原 第 六 章 更 名 为 “医学 研究 证 据 的 系统 
评价 与 weta 分 析 "; @ 原 第 七 章 更 名 为 “临床 研究 设计 的 基本 要 求 ”, 并 整合 了 原 第 十 章 “影响 
研究 质量 的 误差 与 防止 措施 " 和 原 第 十 二 章 “临床 研究 中 的 伦理 学 ”的 内 容 , 分 别 作为 一 节 闻 
述 ; 回 原 第 九 意 更 名 为 “临床 研究 的 常用 设计 方案 ”; @ 原 第 十 七 章 更 名 为 “决策 分 析 "; 中 原 第 
二 十 一 章 更 名 为 “临床 医学 研究 项 目 申报 书 的 撰写 。 





























2 以 临床 科研 设计 、 测 量 、 评 价 等 三 大 基本 原则 为 主线 , 以 病因 诊断 、 治 疗 .预后 等 四 大 
临床 问题 为 切入 点 , 系统 六 述 了 临床 研究 方法 、 评 价 与 循 证 医学 实践 案例 , 将 临床 流行 病 学 与 
循 证 医学 有 机 结合 体现 “证 据 来 源 于 临床 又 服务 于 临床 " 的 宗旨 , 修订 了 本 版 次 的 第 八 章 至 第 
十 一 章 。 

3 强化 了 医学 生 在 科学 探 新 与 临床 实践 中 , 发 现 问题 与 解决 问题 的 能 力 , 充实 和 修订 了 原 
第 二 章 . 增加 了 “如 何 提出 和 构建 临床 研究 问题 及 循 证 医学 实践 问题 " 等 内 容 。 





4 新 增 了 三 意 循 证 医学 的 相关 内 容 , 分 别 是 第 十 二 章 “临床 实践 指南 的 制定 与 评价 ”第 
十 三 竟 * 循 证 医学 的 个 体 化 实践 ”第 十 五 章 “ 循 证 医学 自我 评价 "。 

我 们 共同 的 愿望 是 在 全 国 一 流 教 材 的 基础 上 , 紧 跟 现代 科学 发 展 的 步伐 , 不 断 地 吸收 最 新 
最 佳 证 据 , 与 时 俱 进 地 丰富 本 教材 的 科学 内 涵 , 使 之 永 葆 一 流 的 教材 水 平 , 以 更 好 地 满足 我 国 
临床 医学 教育 改革 及 人 才 培养 的 要 求 。 在 本 版 的 修订 中 , 尽管 全 体 编 委 尽心 尽责 , 但 毫 无 疑问 
地 会 有 某 此 不足 甚至 雇 误 , 敬 希 应 用 本 教材 的 师 生 和 同道 , 给予 批评 和 指正 ! 


量 








在 本 教材 的 修订 中 , 得 到 了 四 川 大 学 华西 临床 医学 院 / 华西 医院 领导 的 大 力 支持 , 并 得 到 
全 国 高 等 医药 教材 建设 研究 会 、 卫 生 部 教材 办 公 室 及 人 民 卫 生出 版 社 的 指导 和 帮助 , 一 并 致 以 
衷心 的 谢意 ! 














在 本 教材 资料 图 表 的 编排 和 辅助 教材 的 编辑 以 及 部 分 内 容 的 编写 、 网 络 增值 服务 资料 的 设 
计 制 作 中 ,学 术 秘书 康德 英和 洪 旗 两 位 老师 做 了 大 量 工作 ,对 他 们 的 辛勤 劳动 和 奉献 , 致 以 诚 
草 的 感谢 ! 


刘 续 宝 王 素 工 


2013 年 1 月 
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彩 图 8-3 ”病因 的 轮 状 模型 
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彩 图 11-7 ”两 组 患者 DFS 和 OS 的 生存 曲线 
A: 大 剂量 Ara-C( HiDAC ) 组 的 DFS 是 43%, 传统 化 疗 ( CT) 组 为 39%(P=0.724); B: HiDAC 
组 和 CT 组 的 5 年 QS 分 别 是 58% 和 56%(P=0.954) 
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彩 图 11-8 染色体 预后 良好 组 的 DFS 和 OS 
A: HiDAG 和 CT 组 的 5 年 DFS 分 别 为 57% 和 39%(P=0.050); B: HiDAC 和 CT 组 的 5 年 OS 
分 别 为 75% 和 66%( P=0.174) 
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因素 与 治疗 效果 的 评估 








临床 流行 病 学 (clinical epidemiology ) 和 循 证 医学 (evidence based medicine, EBM ) 是 始 于 20 世纪 
的 新 兴 临 床 医 学 基础 科学 (a basic science for clinical medicine), 是 临床 医生 进行 临床 医学 科学 研 
究 和 指导 临床 医学 实践 十 分 有 用 的 理论 与 方法 学 , 对 促进 临床 医学 的 科学 发 展 有 着 重要 的 价值 。 


第 一 节 ”历史 与 现状 


20 世纪 医学 的 快速 发 展 促使 人 们 需要 采用 从 定性 走向 定量 、 个 体 研 究 转向 群体 研究 的 科学 
方法 去 认识 和 解决 临床 面临 的 各 种 不 同 复杂 的 医学 问题 , 以 便 从 宏观 角度 更 加 科学 地 指导 临 
床 实践 。 据 此 , 30 年 代 John R. Pual 首先 提出 了 临床 流行 病 学 的 概念 , 后 经 几 十 年 的 努力 , 特别 
是 从 60 年 代 后 , 著名 的 内 科 医 师 David L. Sackett、 Alvan R. Feinstein 等 创造 性 地 将 流行 病 学 和 医 
学 统计 学 原理 和 方法 有 机 地 与 临床 医学 的 研究 和 实践 结合 起 来 , 并 进一步 拓展 到 与 临床 医学 相 
关 的 卫生 经 济 学 和 社会 医学 等 领域 , 极 大 丰富 和 发 展 了 临床 研究 的 方法 学 。 在 临床 研究 实践 中 ， 
提高 了 对 疾病 的 发 生 、 发 展 和 转 归 的 整体 规律 的 宏观 认识 , 深化 了 对 疾病 诊断 、 治 疗 和 防治 方法 
的 科学 观 , 有 效 地 提升 了 临床 医学 研究 和 实践 的 水 平 , 为 现代 临床 流行 病 学 打下 了 坚实 的 基础 。 

临床 流行 病 学 的 最 初 发 展 和 推广 , 致力 于 从 事 临 床 流行 病 学 研究 和 工作 的 临床 医师 、 医 
学 统计 学 家 等 功 不 可 没 , 同时 还 与 国际 上 致力 于 医学 发 展 的 基金 会 和 医学 专业 学 会 的 虚 力 支 
持 密 不 可 分 。 在 美国 洛 氏 基金 会 的 支持 下 , 1982 年 成 立 了 国际 临床 流行 病 学 网 (International 
Clinical Epidemiology Network, INCLEN )。INCLEN 的 宗旨 是 :在 最 可 靠 的 临床 证 据 和 最 有 效 地 
利用 卫生 资源 的 基础 上 , 促进 临床 医学 实践 , 从 而 致力 于 改善 人 类 健康 。 为 实现 这 一 目标 , 本 
工作 网 内 的 各 国 临 床 医生 、 统 计 学 家 及 让 -会 学 家 要 共同 奋斗 , 以 建立 和 维持 最 佳 的 医学 研究 和 
医学 教育 的 能 力 和 水 平 , 这 些 是 致力 于 改善 人 民 健 康 的 最 重要 的 条 件 "。INCLEN 首先 在 美国 、 
加 拿 大 和 澳大利亚 建立 了 七 个 一 级 国际 临床 流行 病 学 资源 和 培训 中 心 (The International Clinical 
Epidemiology Resource and Training Center， CERTC ), 为 全 球 范 围 内 的 著名 大 学 医学 院 培训 了 大 
量 的 临床 流行 病 学 专业 人 员 。 此 后 , 又 相继 在 亚洲 、 非 洲 、 南 美洲 等 地 建立 了 多 个 二 级 的 区 域 
性 的 临床 流行 病 学 资源 和 培训 中 心 (Regional Clinical Epidemiology Resource and Training Center )， 
这 些 资源 和 培训 中 心 承担 了 全 球 和 地 区 性 或 本 国人 员 培 训 和 研究 工作 。 

我 国 临床 流行 病 学 的 起 步 ， 始 于 1982 年 中 国 改革 开放 初期 , 在 国际 基金 会 的 资助 下 , 我 国 
一 批 优秀 的 临床 医学 科学 家 分 赴 美 国 、 加 拿 大 、 澳 大 利 亚 等 一 些 临床 流行 病 起 源 .发展 和 成 熟 
的 国家 学 习 和 工作 。 这 些 学 者 学 成 归 国 后 为 我 国 临 床 流行 病 学 学 科 的 建立 .发展 和 普及 做 了 
大 量 辛勤 的 工作 。 以 四 川 大 学 华西 医院 王家 良 教授 等 为 代表 的 我 国 一 批 临床 流行 病 学 的 葛 基 
人 在 学 科 发 展 的 初期 ,先是 在 本 单位 组 织 、 参 与 和 推动 临床 流行 病 学 的 研究 和 教学 工作 , 继 
而 在 卫生 部 的 大 力 支持 下 , 1983 年 获准 在 原 华西 医科 大 学 ( 现 四 川 大 学 华西 医学 中 心 )、 原 上 海 
医科 大 学 ( 现 复旦 大 学 上 海 医 学 院 ) 和 原 广州 中 医学 院 ( 现 广州 中 医药 大 学 ) 建 立 了 三 个 “设计 、 
衡量 评价 (design, measurement and evaluation, DME) 的 国家 级 培训 中 心 ( the centre of DME on 
the medical research ), 简称 DME 中 心 。 开设 了 临床 医学 本 科 生 和 研究 生 的 临 床 流行 病 学 课程 ， 
并 推动 了 其 他 医学 院 校 的 临床 流行 病 学 教研 室 (或 教研 组 ) 的 建立 和 开展 相应 的 教学 和 研究 
作 。 进 而 在 1989 年 成 立 了 INCLEN 指导 下 的 中 国 临床 流行 病 学 网 ( China Clinical Epidemiology 
Network, ChinaCLEN ); 由 于 临床 流行 病 学 在 中 国 成 功 地 发 展 , 在 INCLEN 的 支持 下 , 分别 在 当 
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时 的 华西 医科 大 学 和 上 海 医科 大 学 成 立 了 两 个 二 级 区 域 性 的 临床 流行 病 学 资源 和 培训 中 心 
(R-CERTC), 并 在 原 中 国 协和 医科 大 学 ( 现 北京 协和 医学 院 ) 以 及 中 国 中 医科 学 院 等 七 所 院 校 
建立 国际 临床 流行 病 学 组 (CEU), 为 国内 培养 了 一 批 临床 流行 病 学 的 研究 和 临床 医学 的 践 行人 
才 , 促进 了 临床 流行 病 学 在 国内 高 等 医学 院 校 的 普及 和 发 展 。 在 学 科普 及 的 基础 上 , 1993 年 正 
式 成 立 了 中 华 医学 会 临床 流行 病 学 分 会 , 这 为 本 学 科 在 我 国 的 快速 发 展 和 迈 向 国际 水 平 奖 定 了 


| 组 织 基础 。 临 床 流行 病 学 在 我 国 30 多 年 的 发 展 , 为 我 国 临床 医学 的 快速 进步 和 赶 超 国 际 水 平 


作出 了 重大 贡献 , 也 为 人 类 的 健康 卫生 事业 作出 了 卓越 贡献 。 

近 数 十 年 来 , 临床 流行 病 学 的 莲 勃 发 展 直接 推动 了 各 临床 学 科 的 科学 水 平 提高 , 尤其 是 在 加 
强国 际 卫生 研究 能 力 、 对 重大 国际 卫生 问题 的 合作 研究 、 促 进发 展 中 国家 人 民 的 健康 水 平 、 卫 生 
资源 的 合理 利用 以 及 为 世界 卫生 组 织 和 各 国政 府 的 卫生 决策 等 , 均 作 出 了 非凡 的 贡献 或 发 挥 了 
重要 影响 。 世 界 卫生 组 织 在 其 2004 年 的 报告 中 , 对 临床 流行 病 学 的 贡献 给 予 了 高 度 评价 , 指出 
“临床 流行 病 学 学 科 的 建立 , 对 在 群体 层面 上 的 疾病 研究 和 临床 干预 作出 了 巨大 贡献 。 其 进展 从 
根本 上 升华 了 测量 疾病 的 定量 方法 , 使 之 在 各 种 群体 层面 上 能 够 可 信 地 评价 干预 治疗 的 结果 ”。 

鉴于 临床 流行 病 学 的 发 展 促进 了 临床 研究 成 果 的 产生 , 而 新 的 研究 成 果 或 称 最 佳 证 据 (best 
evidence ) 应 适时 地 应 用 于 临床 实践 , 方 可 产生 科学 与 实用 价值 , 从 而 促进 临床 医学 水 平和 质量 
的 提高 , 因此 , 在 20 世纪 的 90 年 代 , 在 临床 流行 病 学 的 基础 上 , 继而 催生 了 “ 循 证 医学 (evidence 
based medicine, EBM )” 。 

循 证 医学 的 起 源 , 从 哲理 上 可 以 追溯 到 19 世纪 中 期 。 在 20 世纪 80 年 代 , 以 David L. Sackett 
为 代表 的 一 批 临床 流行 病 学 家 , 倡导 与 催生 的 现代 循 证 医学 , 其 精华 在 于 运用 临床 流行 病 学 的 











| 原理 和 方法 , 检索 、 阅 读 和 评价 相关 的 医学 文献 , 科学 地 寻找 有 效 解决 这 些 临床 问题 的 最 新 科 


学 研究 成 果 , 作为 临床 诊断 和 治疗 决策 的 证 据 基础 , 从 而 科学 地 指导 临床 实践 , 从 而 不 仅 使 病 
人 获得 最 科学 、 合 理 有效 的 治疗 , 而 且 会 不 断 提 高 医生 的 水 平 , 使 其 医疗 质量 水 平 永 居 前 沿 ， 
故 为 临床 医生 终生 的 一 种 最 佳 自我 教育 的 方法 。 从 最 初 对 临床 医师 如 何 阅读 、 评 价 医学 文献 培 


| 训 发 展 到 对 发 表 的 众多 相关 最 新 研究 成 果 进行 二 次 评价 和 综合 研究 的 循 证 医学 培训 , 经 过 多 年 


的 实践 , 取得 了 非常 好 的 效果 , 于 1992 年 在 JAMA 杂志 上 发 表 了 系列 的 循 证 医学 总 结 性 文献 ， 
David L. Sackett 和 B. Haynes 等 人 的 这 一 工作 受到 了 临床 医学 各 学 科 的 关注 。 

在 1993 年 , 国际 上 专门 成 立 了 Cochrane 协作 网 ( Cochrane collaboration network ), 在 全 球 范围 
内 接受 注册 和 广泛 收集 临床 随机 对 照 试验 的 研究 结果 , 在 严 控 质量 的 基础 上 , 对 试验 的 结果 进 
行 系统 评价 (systematic review, SR ) 和 meta 分 析 (meta-analysis), 将 有 价值 的 临床 研究 结果 推荐 给 
临床 专业 医师 和 相关 领域 的 工作 者 。1995 年 , 随 着 David L. Sackett 受聘 于 英国 牛津 大 学 , 成立 了 
全 球 第 一 个 循 证 医学 中 心 , 继而 循 证 医学 专著 以 及 由 英国 和 美国 内 科 医 师 协会 主办 的 循 证 医学 
专业 杂志 相继 出 版 发 行 , 全 面 推介 国际 上 经 过 严格 评价 的 医学 成 果 , 以 促进 这 些 成 果 作为 指导 临 
床 实践 的 证 据 , 进行 临床 转化 以 及 应 用 于 临床 实践 指南 (elinical practice guideline, CPG ) 的 制定 。 

伴随 我 国 临床 流行 病 学 的 发 展 , 循 证 医学 也 获得 了 快速 普及 。1996 年 在 卫生 部 的 支持 下 ， 
中 国 循 证 医学 中 心 和 Cochrane 中 国 中 心 在 原 华西 医科 大 学 成 立 , 相继 编著 与 出 版 了 《 循 证 医学 》 
专营 ,创办 了 《中 国 循 证 医学 杂志 》; 对 外 在 国际 上 开展 了 广泛 交流 和 合作 , 对 内 组 织 了 多 批 次 
国内 临床 医师 和 相关 专业 人 员 培 训 , 推动 了 临床 医学 的 进步 和 发 展 。 


第 二 节 “临床 流行 病 学 与 循 证 医学 的 学 科 特 点 


“临床 流行 病 学 和 循 证 医学 的 概念 
临床 流行 病 学 是 将 现代 流行 病 学 及 统计 学 等 原理 和 理论 引入 临床 医学 的 研究 和 实践 的 一 
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门 临床 方法 学 , 采用 宏观 的 群体 观点 和 相关 的 定量 化 指标 , 将 科学 严谨 的 设计 、 定 量化 的 测量 
和 严格 客观 的 评价 贯穿 于 临床 研究 , 探索 疾病 的 病因 、 诊 断 、 治 疗 和 预后 的 系统 性 规律 , 力求 避 
免 各 种 偏 倚 因素 的 干扰 ,确保 研究 结果 的 真实 性 .并 对 临床 医学 实践 产生 重要 的 循 证 价值 , 因 
此 , 它 重 在 创造 最 佳 的 研究 成 果 , 促进 临床 医学 水 平 的 提高 。 

循 证 医学 是 一 门 临床 实践 的 科学 , 指 医生 在 自己 的 临床 实践 中 , 针对 病人 的 具体 临床 问题 
(难点 ), 谨慎 ,确切 和 明智 地 采用 目前 最 佳 的 证 据 对 病人 的 诊治 做 出 科学 的 决策 , 从 而 取得 最 有 效 
的 治疗 结果 。 这 样 做 既 能 有 效 地 解决 病人 的 临床 问题 , 促进 病人 康复 , 同时 也 会 推动 临床 医疗 水 
平 的 提高 和 临床 医学 的 进步 。 因 此 , 它 重 在 应 用 最 佳 的 研究 成 果 , 解决 个 体 患者 具体 的 临床 问题 。 

可 见 , 临床 流行 病 学 与 循 证 医学 是 理论 联系 实际 、 高 度 统一 的 临床 医学 体系 , 旨 在 推动 临 
床 医学 进步 与 有 效 地 服务 于 人 民 的 健康 事业 。 

二 、 临 床 流行 病 学 和 循 证 医学 是 以 临床 医学 为 主体 的 多 学 科 合 作 

临床 流行 病 学 和 循 证 医学 的 学 科 主 体 是 临床 医学 , 重 在 临床 科研 与 临床 实践 。 过 去 , 临床 
医师 通常 面 对 的 诊治 对 象 是 个 体 , 缺乏 群体 观念 , 临床 研究 常常 成 了 个 体 案例 的 累加 与 总 结 分 
析 , 这 些 经 验 性 的 临床 研究 往往 蕴藏 了 大 量 的 偏 倚 、 混 杂 和 机 遇 因 素 , 所 得 出 的 研究 结果 或 结 
论 往 往 偏离 于 客观 的 真实 性 。 现 在 , 临床 医学 的 研究 , 以 临床 为 基础 ,将 视角 注重 于 群体 观念 
和 定量 化 的 观点 , 借鉴 和 采用 了 大 量 有 关 流 行 病 学 、 卫 生 统 计 学 、 卫 生 经 济 学 及 其 他 基础 医学 
的 原理 和 方法 ,创新 和 发 展 了 新 型 、 科 学 和 实用 的 临床 研究 方法 (临床 流行 病 学 与 循 证 医学 )， 
应 用 这 些 原理 和 方法 , 既 有 利于 创新 临床 研究 , 又 有 助 于 临床 实践 , 促进 临床 研究 成 果 转 化 , 服 
务 于 临床 诊治 实践 。 所 以 , 临床 流行 病 学 及 其 后 续 的 循 证 医学 是 一 门 以 临床 医学 研究 为 基础 的 
交叉 融 人 了 流行 病 学 、 卫 生 统计 学 、 卫 生 经 济 学 、 医 学 社会 学 等 多 门 学 科 的 临床 医学 基础 学 科 。 

三 、 临 床 流行 病 学 的 研究 对 象 是 病人 及 其 群体 

临床 流行 病 学 的 研究 对 象 是 以 医院 为 基础 的 病人 及 其 相应 的 患 病 群 体 , 这 种 特定 疾病 的 群 
体 性 (specified population of disease) 乃 为 本 学 科 的 "流行 病 学 " 特征。 这 种 群体 性 的 特征 与 传统 
的 局 限于 医院 的 临床 医学 有 很 大 的 不 同 ， 它 是 从 医院 的 患 病 病 人 延伸 至 社会 的 特定 疾病 人 群 ， 
将 医院 内 特定 疾病 的 病人 诊治 和 社会 人 群 的 特定 疾病 的 诊治 研究 相 结 合 , 跨越 了 医院 或 社会 人 
群 的 界限 ,无疑 对 疾病 的 早期 发 现 与 防治 , 以 及 对 疾病 发 生 、 发 展 和 转 归 规律 的 认识 更 加 全 面 系 
统 和 深入 , 因此 , 本 学 科 对 临床 医学 的 发 展 有 重要 价值 和 意义 。 但 因 其 临床 基础 和 基于 医院 背景 
下 的 研究 人 群 .临床 流行 病 学 的 理论 体系 、 研 究 范畴 、 防 治 实践 等 多 个 方面 又 有 别 于 流行 病 学 。 

四 、 临 床 流行 病 学 力求 研究 结果 的 真实 性 与 可 靠 性 

临床 流行 病 学 的 精髓 还 是 在 于 强调 : 在 临床 医学 研究 中 采用 科学 的 方法 学 , 强化 科学 研究 
的 设计 和 实施 , 以 便 从 根本 上 排除 各 种 偏 倚 、 混 杂 因素 对 研究 结果 的 影响 ,确保 研究 结果 是 真 
实情 况 的 反映 , 即 研究 结果 真实 反映 了 疾病 的 发 病 、 过 程 和 转 归 , 即 研 究 结 果 的 真实 性 (validity ) 
和 研究 结论 的 可 靠 性 (reliability )。 具 有 真实 研究 结果 和 可 靠 研究 结论 的 成 果 , 对 临床 的 循 证 诊 
治 决策 起 到 正确 的 指导 作用 。 

五 、 循 证 医学 的 临床 实践 基础 

循 证 医学 是 临床 实践 活动 , 当然 其 基础 包括 实践 活动 主体 的 临床 医师 .服务 主体 的 病人 、 
遵循 的 最 佳 证 据 、 筛 检 和 使 用 证 据 的 理论 与 方法 以 及 实践 活动 的 医疗 平台 。 

(一 ) 医师 

高 素质 的 临床 医师 是 循 证 医学 实践 的 主体 。 良 好 素质 表现 为 在 处 理 病人 的 诊治 时 , 既 能 善 
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于 利用 个 人 临床 技能 和 丰富 的 专业 知识 , 同时 也 善于 使 用 获得 的 最 佳 的 证 据 。 如 果 没 有 优秀 的 
临床 技能 , 再 好 的 证 据 也 难 用 于 病人 的 诊治 ; 如 果 医 生 缺 乏 识 别 最 新 最 佳 的 研究 成 果 的 能 力 ， 
再 好 的 诊治 病人 的 技术 和 手段 ,也 将 不 会 被 采用 , 因而 必然 落后 于 时 代 。 
(二 ) 病人 
病人 是 循 证 医学 实践 的 服务 主体 。 接 受 医师 的 治疗 不 但 是 病人 出 于 对 自己 健康 的 关注 , 同 
时 ,非常 重要 的 也 是 出 于 对 医师 的 信任 。 任 何 循 证 医学 实践 均 需 要 病人 的 合作 与 配合 , 如 果 病 
人 缺乏 对 诊治 医师 的 信任 , 则 依从 性 就 不 能 获得 保证 。 因 此 , 尊重 病人 , 将 病人 的 利益 放 在 首 
位 , 建立 良好 的 医 患 关系 并 取得 病人 的 合作 是 实现 循 证 医学 实践 的 重要 基础 之 一 。 
(三 ) 最 佳 证 据 
最 佳 证 据 乃 是 来 源 于 现代 临床 医学 的 研究 成 果 , 这 些 成 果 经 过 严谨 评价 而 确认 是 真实 的 、 
有 重要 临床 意义 且 又 有 实用 价值 的 , 方 为 最 佳 证 据 (best evidence )。 最 佳 证 据 为 实践 循 证 医学 
的 “武器 ”, 是 临床 上 解决 病人 问题 的 最 新 和 最 佳 的 手段 。 而 这 种 证 据 的 获取 , 则 是 根据 临床 面 
临 的 具体 问题 , 在 全 球 范围 内 所 有 的 相应 最 新 研究 成 果 中 , 应 用 科学 的 方法 去 检索 .分析 与 记 
价 , 而 获得 的 最 新 、 最 佳 的 证 据 成 果 , 并 用 于 临床 问题 的 解决。 
(四 ) 临床 流行 病 学 的 基本 知识 与 方法 学 
由 于 分 析 和 评价 最 佳 证 据 的 方法 与 标准 , 都 源 于 临床 流行 病 学 的 基本 理论 与 临床 研究 质量 
的 评价 原则 , 且 诸 多 的 研究 成 果 中 , 由 于 研究 的 设计 、 方 法 和 研究 条 件 的 限制 , 并 非 都 是 最 佳 的 
| 证 据 。 因 此 , 在 实践 循 证 医学 中 使 用 “最 佳 证 据 ” 的 时 候 , 一 定 要 结合 临床 实际 , 持 批判 性 的 态 
度 。 当 对 某 种 ( 些 ) 证 据 有 疑问 时 , 应 查 其 原始 来 源 并 用 临床 流行 病 学 有 关 理论 与 方法 进行 分 析 
和 评价 ,这 样 方 可 避免 被 误导 或 误 用 , 从 而 避免 对 病人 的 伤害 。 
(五 ) 医疗 平台 
循 证 医学 实践 都 要 在 具体 的 医疗 平台 上 实施 。 地 区 经 济 的 差异 、 级 别 不 同 的 医院 , 设备 条 
| 件 和 医务 人 员 的 技术 水 平 各 异 。 某 些 治疗 措施 和 方法 的 疗效 很 好 , 但 需要 借助 一 定 的 设备 或 党 
| 握 了 相当 难度 的 技术 的 医师 作为 支持 , 如 果 缺 乏 这 些 条 件 , 也 是 难以 实现 的 。 因 此 , 循 证 医学 
实践 应 结合 具体 的 医疗 平台 作为 基础 , 不 可 盲从 。 
俐 床 循 证 医学 实践 , 则 首先 必须 准确 地 发 掘 病人 存在 并 需要 解决 (回答 ) 的 临床 问题 ; 根据 
临床 问题 去 检索 相关 的 资料 及 文献 ; 对 收集 到 的 文献 进行 严格 的 评价 , 以 找 出 “最 新 最 佳 证 据 ”; 
针对 病人 的 具体 情况 ,权衡 利 论 ,将 最 佳 证 据 用 以 循 证 医疗 决策 付 诸 执行 ; 最 后 分 析 与 评价 最 
终结 果 。 这 就 是 实践 循 证 医学 的 “五 步 曲 "( 图 1-1)。 
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图 1-1 临床 循 证 实践 示意 图 
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第 三 节 ”临床 流行 病 学 与 流行 病 学 的 关系 


流行 病 学 是 研究 特定 人 群 中 的 健康 相关 状况 或 疾病 事件 的 分 布 及 其 决定 因素 , 同时 要 应 用 
这 种 研究 的 结果 去 解决 健康 问题 '。 

可 见 , 该 学 科 是 定位 于 人 类 社会 中 的 特定 人 群 , 目的 是 研究 人 群 的 健康 相关 状况 和 疾病 事 
件 的 分 布 和 它们 发 生 的 相关 因素 , 并 应 用 研究 的 结果 去 有 效 地 改善 人 民 健 康 并 控制 相关 的 疾 
病 。 例 如 : 某 些 急性 传染 病 一 一 天 花 、 霍 乱 、 伤 寒 、 病 毒性 肝炎 、 严 重 急性 呼吸 综合 征 (SARS) 等 
在 人 群 中 的 发 生 与 流行 规律 以 及 应 用 研究 出 的 特异 性 疫苗 和 相应 措施 在 人 群 中 进行 有 效 防治 ， 
以 解决 人 群 中 的 健康 问题 。 

临床 流行 病 学 则 是 临床 学 家 学 习 与 应 用 了 流行 病 学 的 原理 与 方法 ,结合 了 临床 医学 的 实 
际 , 研究 特定 疾病 的 “群体 ”分 布 及 其 临床 特征 , 包括 病因 、 危 险 因素 、 诊 断 、 治 疗 以 及 预后 等 ， 
以 期 获得 最 佳 研究 结果 , 并 且 要 应 用 这 些 具有 群体 特征 性 的 研究 结果 , 面 对 个 体 串 者 的 具体 情 
况 , 作 出 科学 预测 性 的 防治 决策 , 以 解决 具体 病人 的 健康 问题 , 可 见 , 它 所 涉及 的 是 具体 的 疾病 
及 其 在 临床 方面 的 诊治 。 这 与 流行 病 学 是 有 所 差异 的 。 因 而 , 尽管 在 解决 人 类 健康 或 疾病 防治 
等 问题 上 各 有 侧重 , 但 在 学 科 的 理论 和 方法 学 上 却 有 着 密切 的 关联 。 正 如 临床 流行 病 学 的 创始 
人 John R.Paul 早年 提出 的 “临床 流行 病 学 ” 是 将 流行 病 学 家 在 人 群 中 用 于 研究 疾病 的 定量 化 的 
概念 和 临床 医学 ( 生 ) 日 常用 于 对 个 体 患 者 诊治 决策 之 间 的 紧密 融合 *。 

Robert H. Fletcher 在 论证 临床 流行 病 学 与 流行 病 学 两 者 关系 时 , 颇 为 精辟 地 认为 : 临床 流行 
病 学 本 身 是 源 于 临床 医学 和 流行 病 学 两 大 学 科 , 说 它 是 “临床 " 是 因为 要 回答 的 是 临床 问题 , 并 
用 最 佳 证 据 指导 临床 决策 ; 说 它 是 “流行 病 学 " 则 指 用 以 回答 临床 问题 的 方法 , 很 多 是 由 流行 
病 学 家 所 创 用 的 , 同时 对 个 体 患者 医疗 决策 的 最 佳 证 据 往 往 源 于 对 患 病 群体 的 较 大 样本 的 研究 
成 果 。 

当前 ,我国 临床 流行 病 学 的 发 展 , 在 专业 队伍 中 , 一 部 分 为 临床 医生 经 过 正规 的 临床 流行 
病 学 专业 培训 而 成 为 临床 流行 病 学 “家 ”; 另 一 部 分 为 流行 病 学 家 通过 面向 临床 医学 的 临床 研究 
与 教学 实践 而 “过渡” 成 为 临床 流行 病 学 家 。 正 如 前 述 这 种 学 科 彼 此 交叉 和 结合 , 必 将 有 利于 科 
学 的 发 展 。 








第 四 节 ”临床 流行 病 学 与 循 证 医学 的 方法 学 


临床 研究 的 复杂 性 源 于 病人 的 临床 特点 , 即 疾病 病程 、 心 理 状态 和 社会 经 济 状况 等 各 异 ， 
以 及 机 体 不 同系 统 .器 官 病变 间 的 相互 影响 ， 构成 了 同一 疾病 的 不 同 患者 临床 表现 的 不 一 致 性 。 
而 临床 研究 的 基本 资料 来 源 是 病人 的 症状 及 相关 病史 、 体 检 发 现 的 阳性 及 重要 的 阴性 体征 、 实 
验 室 及 蘑 些 特殊 检查 的 结果 , 这 些 资料 的 采集 出 于 多 个 专业 部 门 和 人 员 , 人 员 的 临床 专业 素质 、 
业务 水 平 并 非 相 同 ， 即 研究 的 实施 人 员 之 间 也 存在 认 知 的 不 一 致 性 。 因此 ,病史 的 收集 整理 是 
否 符 合 实际 , 体征 是 否 准 确 , 实验 等 检查 结果 是 否 真实 可 靠 , 多 种 明显 因素 和 隐匿 因素 ( 偏 倚 
或 /和 混杂 因素 ) 都 可 能 对 结果 的 真实 与 否 产生 影响 , 并 直接 关系 到 临床 研究 的 质量 。 面 对 病 
人 的 复杂 临床 状况 以 及 多 源 性 的 临床 资料 , 如 果 没 有 科学 的 方法 来 收集 、 整 理 和 处 理 , 则 难以 
识别 及 防止 各 种 已 知 和 未 知 偏 倚 因 素 的 干扰 ,那么 就 很 难保 证 临床 研究 结果 和 诊治 疾病 的 科学 





! Epidemiology: The study of the distribution and determinants of health-related states or events in specified populations, and 
application of this study to control of health problems. IEA.A dictionary of Epidemiology.4th ed.2001: 62 
? A marriage between quantitative concept used by epidemiologists to study disease in populations and decision-making in the 


individual case which is the daily fare of clinical medicine. [EA.A Dictionary of Epidemiology.4th ed.2001: 30 
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性 和 可 靠 性 。 因 此 , 采用 这 些 研 究 结果 来 指导 临床 的 诊治 , 很 可 能 导致 决策 失误 , 使 病人 接受 
并 非 正确 或 最 佳 的 诊断 和 治疗 。 

回顾 性 的 传统 临床 医学 研究 , 通常 是 在 现 有 资料 基础 上 进行 , 由 于 资料 并 非 为 所 进行 的 研 
究 而 收集 , 必然 存在 一 些 偏 傈 和 混杂 因素 , 因此 , 结果 的 真实 性 很 受 影响 。 即 使 进行 的 研究 是 
前 瞻 性 的 , 如 果 存 在 严重 的 设计 缺陷 , 导致 不 能 有 效 控制 已 知 和 未 知 的 偏 倚 因 素 和 (或 ) 混 杂 因 
素 , 其 研究 的 结果 也 必然 偏离 真实 的 结果 。 因 此 , 面 对 临床 医学 研究 中 的 复杂 情况 , 临床 流行 
病 学 的 先驱 们 , 创造 性 地 将 临床 研究 资料 的 特殊 性 与 流行 病 学 和 统计 学 的 方法 学 结合 , 建立 了 
以 设计 (design)、 测 量 (measurement)、 评 价 (evaluation) 为 三 大 核心 的 临床 科研 方法 学 (DME), 应 
用 于 复杂 的 临床 医学 研究 之 中 。 





一 . 设 计 
临床 研究 的 设计 主要 围绕 以 下 六 大 要 素 进行 : 疾病 病人 / 人 群 (patients/population ): 即 
研究 的 疾病 和 病人 人 和 群 来 自 什么 地 方 的 医院 和 人 和 群 、 采 用 的 诊断 标准 及 有 无 明确 的 纳入 / 排除 
标准 、 多 大 的 样本 量 、 受 试 者 是 否 愿意 参与 试验 、 依 从 性 如 何等 都 需要 明确 和 说 明 。@ 研 究 设 
计 (design): 是 何 种 方案 ,设计 方案 的 科学 性 与 实用 性 如 何 。@ 干 预 措施 (intervention ): 是 否 有 





| 科学 依据 ,有 效 性 和 安全 性 的 前 期 试验 依据 ,具体 的 应 用 方法 、 疗 效 与 不 良 反应 的 指标 、 是 否 同 


时 采用 其 他 辅助 疗法 等 。@ 对 照 ( comparison ) 的 方法 : 对 照 组 受 试 对 象 的 人 选 标准 和 方法 、 来 
源 何 处 、 同 期 或 非 同期 对照 组 接受 的 干预 措施 是 安慰 剂 或 其 他 有 效 干 预 措施 等 。@ 研 究 的 结 
果 (outeomes): 反映 有 益 ( 有 效 ) 及 不 良 反应 (有 害 ) 的 结果 的 指标 依据 ,判断 的 方法 以 及 校正 与 
否 等 。@ 时 间 因素 (time): 干预 措施 的 疗程 需要 多 长 时 间 , 是 否 能 满足 药 效 或 不 良 反 应 显效 的 
时 间 要 求 ， 即 试验 研究 回答 试验 组 与 对 照 组 效应 差异 的 统计 学 所 需 的 最 低 限 度 水 平 (minimally 





| important difference, MID ) 所 用 的 时 间 。 对 于 某 些 疾病 设 定 的 追踪 观察 时 间 的 长 短 , 需要 注意 疾 


病 的 自然 病史 的 时 间 规律 。“PDICOT" 是 上 述 要 点 英文 名 词 的 第 一 字母 的 缩写 , 牢记 “PDICOT”， 
对 自己 的 临床 研究 和 评价 阅读 的 文献 将 是 非常 有 益 的 。 

(一 ) 设计 方案 的 合理 选择 

任何 临床 研究 的 实施 都 脱离 不 了 设计 方案 , 一 个 研究 的 成 功 与 否 , 设计 方案 的 质量 是 非常 
重要 的 一 环 。 根 据 不 同性 质 的 临床 研究 课题 和 研究 条 件 选 择 设计 方案 , 不 仅 要 注重 方案 的 科学 
性 , 同时 也 要 考虑 方案 的 可 行 性 。 通 常 来 讲 , 在 可 行 性 的 基础 上 选择 论证 强度 越 强 的 设计 方案 ， 
同时 避免 为 了 片面 追求 论证 强度 而 忽略 了 方案 实施 的 条 件 , 使 研究 难以 在 现实 条 件 下 进行 。 表 
1-1 列 出 了 不 同性 质 研究 通常 应 用 的 设计 方案 。 表 内 的 “+” 数目 表示 论证 强度 及 可 行 性 , “+” 的 
数目 越 多 则 表示 论证 强度 越 高 或 可 行 性 越 好 。 

(二 ) 研究 对 象 的 正确 诊断 

为 确保 研究 对 象 的 可 靠 性 , 需要 采用 临床 公认 的 诊断 标准 对 研究 对 象 做 出 正确 的 诊断 , 确 
保 研 究 疾病 分 类 的 准确 性 。 同 时 按 课题 设计 的 具体 要 求 , 确定 严格 、 明 确 的 纳入 标准 及 排除 标 
准 , 保证 研究 对 象 的 基线 一 致 性 和 减少 非 研究 因素 对 结果 的 影响 。 

(三 ) 研究 对 象 的 来 源 与 样本 含量 的 估算 

临床 研究 的 背景 是 医院 ,研究 对 象 也 主要 是 医院 就 诊 的 病人 。 根 据 研究 设计 的 要 求 , 研究 
对 象 可 以 是 收治 的 系列 病人 , 但 对 于 患 病 率 高 的 慢性 疾病 (如 高 血压 的 治疗 研究 ), 研究 对 象 也 
可 以 从 患 病 群体 中 随机 抽样 产生 。 

样本 量 是 临床 研究 所 需要 的 基本 的 研究 对 象 (病人 ) 的 例 数 , 基于 这 个 样本 量 的 研究 结果 基 
本 可 以 代表 研究 对 象 总 体 的 客观 性 质 和 效应 特征 , 又 不 至 于 存在 影响 研究 结果 与 总 体 实际 情况 
的 误差 太 大 的 风险 。 样 本 量 过 小 , 研究 结果 可 能 不 能 反映 总 体 的 实际 情况 , 样本 量 过 大 , 不 仅 
延长 了 人 研究 时 间 , 并 造成 人 力 资源 浪费 和 成 本 增高 。 通 常 样本 量 根据 具有 产生 有 临床 价值 的 效 











表 1-1 不 同性 质 的 研究 的 备 选 研究 方案 

















备 选 方案 论证 强度 可 行 性 
一 一 随 宙 对 照 试 验 (randomized controlled trial , RCT) 二 = 
(aetiology/risk factor ) 队列 研究 (cohort study ) +++ t+ 
一 一 病例 对 照 研究 (case-control study ) + 二 
一 一 描述 性 研究 (descriptive study )” 起 + 
诊断 性 试验 金 标 准 方法 对 照 , 系列 诊断 指标 评价 i -HH+ 





(diagnostic study ) 











防治 性 研究 一 一 随机 对 照 试 验 (RCT ) 二 二 
{prevention/treatment ) 交叉 试验 (cross-over study ) 4 证 下 
一 一 前 -后 对 照 试 验 (hbefore-after study ) 这 二 
病例 对 照 研 究 (case-control study ) 下 开本 
一 一 描述 性 研究 (descriptive study ) 区 和 
预后 研究 一 一 队列 研究 (cohort study) Ftp a 
(prognosis ) 病例 对 照 研 究 ( case-control study ) 第 了 演讲 
一 一 描述 性 研究 (descriptive study ) 土 和 
一 疾病 的 现 况 调查 es 
一 一 叙述 性 研究 十 二 HH 





“ 含 横断 面 油 查 (eross-sectional study ) 


应 值 作为 试验 组 与 对 照 组 的 假设 性 差异 水 平 值 , 以 及 容许 的 低 水 平 概率 错误 水 平 (包括 总 体 之 
间 并 非 存 在 差异 而 研究 结果 错误 认为 存在 差异 的 I 型 错误 和 总 体 之 间 存 在 差异 而 研究 结果 未 能 
给 出 的 了 [型 错误 ), 并 依据 设计 的 研究 方案 的 性 质 , 选择 相应 的 样本 含量 的 计算 公式 进行 计算 。 

(四 ) 创新 性 的 试验 措施 

创新 性 的 试验 干预 措施 才 具 有 推动 相关 医学 进步 的 意义 , 重复 性 研究 不 仅 价 值 有 限 , 并 可 
能 造成 人 力 .物力 等 资源 的 浪费 。 同 时 , 试验 干预 措施 还 应 具备 有 效 性 的 科学 依据 , 安全 性 也 
是 需要 考虑 的 重要 方面 , 需要 有 相关 的 研究 证 据 , 对 接受 试验 措施 的 对 象 要 有 安全 性 的 保障 。 

{五 ) 试验 观察 期 的 确定 

临床 试验 观察 期 的 时 间 长 度 要 根据 试验 终点 的 设计 指标 而 定 , 如 终点 指标 是 痊愈 死亡、 
有 效 、 无 效 等 。 大 多 数 试验 对 象 达 到 终点 需要 的 时 间 即 定 为 试验 观察 期 , 这 需要 考虑 疾病 本 身 
的 自然 病程 和 其 他 药物 治疗 反应 的 临床 过 程 。 对 于 通常 药物 治疗 性 临床 试验 的 观察 期 的 确定 ， 
宜 采 用 MID 原则 , 它 的 确定 要 有 生物 学 及 临床 的 试验 依据 。 观 察 过 短 易 致 假 阴 性 结论 , 过 长 则 
导致 资源 的 浪费 。 

(六 ) 识别 和 防止 偏 佑 因素 的 措施 

由 于 临床 研究 的 复杂 性 , 各 种 已 知 和 未 知 的 偏 倚 因素 不 可 避免 地 存在 于 研究 的 过 程 的 各 个 
环节 , 偏 倚 因 素 不 仅 可 能 对 研究 的 结果 产生 扭曲 , 甚至 颠覆 研究 结果 的 客观 真实 性 。 因 此 在 设 
计 中 要 估计 到 研究 中 可 能 存在 的 偏 倚 因 素 , 建立 具体 的 防止 和 排除 偏 傈 因素 的 对 策 , 确保 研究 
结果 真实 可 靠 。 

(七 ) 统计 学 分 析 方法 的 应 用 

根据 研究 采用 的 设计 方法 .采用 的 有 关 测 试 的 指标 和 试验 干预 措施 可 能 产生 的 预期 结果 及 
其 相关 资料 的 类 型 , 正确 地 使 用 有 关 统 计 学 的 分 析 方 法 。 临 床 研究 的 资料 有 定量 的 、 定 性 的 ， 
也 有 等 级 的 ; 有 的 是 配对 的 , 有 的 是 非 配对 的 ; 有 的 研究 结果 需要 多 组 比较 , 也 有 的 仅 两 组 问 的 
结果 相 比 较 ; 有 的 需要 作 单 因素 分 析 , 也 有 的 需要 作 多 因素 分 析 ; 总 之 , 不 同类 型 的 研究 资料 ， 
应 采用 不 同 的 统计 学 方法 ,予以 分 析 比较 和 评价 。 正 确 选 择 统计 学 方法 对 提高 研究 质量 是 非常 
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重要 的 ,统计 学 方法 选择 错误 或 不 恰当 , 常 可 导致 对 结果 的 错误 分 析 而 得 出 错误 的 结论 。 另 外 ， 
所 涉及 的 统计 分 析 方 法 应 在 研究 设计 的 阶段 根据 研究 试验 的 检测 指标 和 资料 类 型 就 应 基本 确 
定 , 而 不 是 在 研究 结束 后 对 所 获 的 资料 和 相关 数据 , 随意 选择 统计 学 的 方法 , 这 不 是 严谨 、 科 学 
的 做 法 。 对 进行 临床 研究 的 临床 医师 而 言 , 如 何 选择 正确 的 统计 学 , 可 以 多 倾听 统计 学 专业 的 
人 员 的 建议 和 意见 , 并 进行 讨论 , 同时 善于 利用 现 有 的 统计 学 软件 。 为 避免 倾向 性 , 将 结果 的 
统计 学 分 析 交 由 医学 统计 专业 工作 者 进行 言 法 处 理 是 更 合理 的 做 法 。 

( 八 ) 科研 道德 

临床 试验 的 受 试 对 象 是 病人 , 受 试 者 享有 知情 权利 。 因 此 , 应 将 研究 的 目的 、 参 加 试验 可 
能 的 获 益 和 可 能 发 生 的 问题 包括 不 良 反应 等 , 以 及 研究 者 的 责任 和 受 试 者 的 义务 告知 受 试 者 或 
其 监护 人 , 让 受 试 者 评估 、 理 解 和 按 自己 的 意愿 决定 是 否 参与 。 不 应 隐瞒 受 试 者 在 试验 中 可 能 
发 生 的 风险 或 夸大 受 试 者 可 能 获得 的 利益 。 并 且 , 在 研究 的 设计 和 执行 的 各 个 环节 都 要 充分 考 
虑 和 尊重 病人 的 权利 , 维护 病人 的 利益 。 

这 八 个 方面 是 临床 研究 设计 方案 时 需要 重点 考虑 的 , 也 可 以 说 是 方案 设计 的 基本 框架 。 


二 、 测 量 


用 某 种 方法 或 指标 来 发 现 、 确 定 和 计量 病人 接受 药物 治疗 或 者 其 他 治疗 后 的 效应 , 或 者 用 
某 种 方法 或 指标 发 现 确定 和 计量 人 体 对 某 种 致 病因 素 产 生 的 反应 , 这 些 发 现 、 确 定 和 计量 治疗 
效应 或 治 病 效应 的 方法 称 为 测量 , 并 将 测量 的 结果 作为 治疗 效果 或 诊断 的 依据 。 为 了 准确 地 对 
产生 致 病 或 治疗 效应 的 测量 , 需要 注意 下 列 几 点 : 

(一 ) 试验 措施 的 效应 性 和 可 度量 性 i 

作为 试验 的 致 病因 素 或 治疗 措施 , 其 本 身 应 该 具有 产生 致 病 或 治疗 的 效应 , 且 这 种 效应 能 
客观 地 确定 并 被 临床 及 实验 室 等 检查 方法 及 指标 度量 。 

(二 ) 测量 方法 的 灵敏 性 和 特异 性 

测量 方法 应 具有 良好 的 灵敏 性 ,能够 发 现 致 病 或 治疗 效应 , 并 且 有 良好 的 特异 性 对 这 些 效 
应 予以 确定 。 否 则 ,会 发 生 漏诊 ( 测 ) 或 误诊 ( 测 ) 的 错误 。 

(三 ) 测量 指标 的 数据 和 | 临床 意义 

测量 临床 效应 的 指标 , 包括 定量 数据 、 多 项 等 级 数据 和 定性 数据 和 计数 数据 。 定 量 的 数据 
如 血液 生化 指标 、 身 高 、 体 重 等 , 多 项 等 级 数据 如 病情 的 轻 、 中 、 重 ,定性 数据 死亡 、 存 活 和 有 
效 、 无 效 等 ,计数 数据 包括 病死 率 、 并 发 症 发 生 率 、 伤 残 率 等 。 针 对 众多 数据 , 均 需 要 根据 公认 
的 临床 标准 简化 为 临床 上 具有 重要 价值 的 也 是 病人 最 为 关心 的 定性 数据 , 如 有 效 或 无 效 等 , 但 
在 表现 效应 量 上 ,定量 数据 最 能 说 明 问题 。 同 时 需要 说 明 的 是 在 测量 结果 的 判断 上 , 重视 结果 
的 临床 意义 和 统计 学 意义 的 综合 分 析 , 如 治疗 效应 量 或 治疗 有 效率 是 否 具有 临床 意义 和 统计 学 
意义 ,如果 二 者 篆 有 , 则 结果 有 实用 价值 ,如 果 二 者 省 无 , 则 结果 没有 任何 价值 。 关 键 的 问题 是 
结果 只 有 其 一 ,对 临床 价值 来 讲 , 更 看 重 的 是 临床 意义 , 单纯 具有 统计 学 意义 而 无 临床 意义 的 
结果 同样 也 没有 实用 价值 。 








三 、 评 价 
临床 研究 结果 是 否 真实 可 靠 、 临 床 意义 和 实用 价值 有 多 大 .研究 结果 能 否 适用 于 临床 实践 
及 其 适用 程度 等 , 都 是 研究 者 对 自己 研究 成 果 的 评价 需要 回答 的 问题 , 同时 也 是 临床 医生 能 否 
采用 某 一 研究 成 果 作为 循 证 医学 临床 决策 时 的 证 据 所 要 予以 严格 评价 的 问题 。 
(一 ) 研究 的 真实 性 (validity) 
无 论 研究 得 到 的 是 阳性 的 结果 还 是 阴性 的 结果 , 都 需要 对 研究 的 客观 测量 指标 做 出 科学 的 
解释 和 结论 ,确保 研究 的 真实 性 及 其 可 信 程度 。 
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真实 性 的 评价 贯穿 于 整个 研究 方案 的 各 个 环节 , 如 设计 方案 的 性 质 和 论证 强度 以 及 存在 的 
缺陷 。 具 体 到 研究 过 程 , 应 着 重 了 解 对 照 组 的 有 无 以 及 设置 是 否 合理 、 研 究 对 象 的 诊断 标准 是 
否 科学 可 靠 、 纳 入 / 排除 标准 是 否 恰当 、 样 本 量 是 否 足够 、 组 间 重 要 的 基线 状况 是 否 可 比 、 有 无 
相关 偏 倚 因 素 存 在 以 及 是 否 采取 了 相应 的 防止 或 处 理 的 措施 、 受 试 者 依从 性 如 何 、 对 相应 的 试 
验 观测 指标 及 资料 所 采用 的 整理 、 统 计 分 析 方 法 是 否 正确 等 。 

(二 ) 临床 重要 性 (clinical importance) 

如 果 研 究 结 果 的 真实 性 良好 , 对 临床 更 重要 的 是 研究 结果 的 临床 意义 和 价值 。 具 有 临床 价 
值 的 研究 结果 不 仅 提高 人 们 对 疾病 及 其 治疗 的 认识 , 而 且 可 以 作为 具有 指导 临床 实践 的 循 证 医 
学 证 据 。 当 然 , 这 些 重要 性 需要 具体 量化 的 指标 来 体现 。 

量化 临床 研究 结果 重要 性 的 指标 有 多 种 , 主要 为 事件 发 生 率 及 其 变化 , 归纳 为 事件 发 生 率 
(event rate )( 如 病死 率 、 生 存 率 、 治 愈 率 …… )、 绝 对 危险 降低 率 (absolute risk reduction, ARR)、 绝 
对 获 益 增高 率 (absolute benefit increase, ABI)、 相 对 危险 降低 率 (relative risk reduction, RRR)、 相 
对 获 益 增高 率 (relative benefit increase, RBI), 需 治 疗 多 少 例 患 者 才能 获得 一 例 最 佳 效 果 (number 
needed to treat, NNT) 以 及 需 治疗 多 少 例 患者 才能 发 现 一 例 不 良 反 应 (number needed to harm, NNH)， 
根据 它们 的 具体 数据 可 计算 各 自 的 95% 可 信和 区间 。 此 外 ,用 于 诊断 性 试验 评价 患者 亦 有 一 系 
列 量化 指标 ( 见 本 教材 第 九 章 )。 这 些 量化 指标 都 能 清楚 地 表明 : 试验 组 与 对 照 组 相 比 所 示 的 具 
体 有 效 以 及 不 良 反应 程度 , 便于 临床 评价 。 

传统 的 临床 研究 结果 , 特别 是 定量 化 的 资料 , 常常 计算 组 间 均 值 以 互相 比较 , 如 果 P<0.05， 
则 认为 组 间 差 异 有 统计 学 意义 , 往往 下 结论 认为 某 组 的 效果 优 于 另 一 组 的 效果 。 这 里 要 强调 的 
是 组 间 差 值 的 大 小 究竟 有 无 临床 意义 ， 如 果 没 有 临床 意义 的 话 , 即使 具有 统计 学 差异 , 也 无 临 
床 应 用 价值 。 因 此 ， 统计 学 分 析 组 间 差 异 的 显著 性 并 不 能 完全 代表 临床 的 意义 。 所 以 , 对 于 任 
何 临床 研究 的 结果 , 务必 要 注重 临床 的 价值 ， 如 果 研 究 的 结果 具有 临床 意义 的 话 , 那么 必须 应 
用 正确 的 统计 学 方法 对 结果 进行 显著 性 检验 , 以 评价 临床 差异 的 真实 程度 , 即 肯定 结果 的 真 阳 
性 、 真 阴性 的 概率 以 及 检验 效能 的 水 平 。 当 某 种 研究 结果 既 有 临床 意义 , 又 有 统计 学 的 差异 显 
著 性 时 , 即 能 作出 肯定 性 的 结论 ; 如 仅 有 临床 的 意义 而 统计 学 差异 并 不 显著 时 , 不 能 因此 而 否 
定 临 床 的 价值 ， 此 时 应 计算 工 型 错误 和 检验 效能 的 水 平 ; 如 果 一 个 研究 的 结果 既 无 临床 意义 , 又 
无 统计 学 显著 差异 ， 则 这 种 研究 的 结果 应 予 否 定 ( 表 1-2)。 

















表 1-2 ”临床 意义 与 统计 学 意义 评价 





临床 意义 统计 学 意义 结论 
A + i + 
B 十 Car 
C 十 十 ~ 士 


二 


临床 研究 的 结果 ， 必要 时 还 应 做 卫生 经 济 学 的 评价 , 计算 其 成 本 - 效果 (cost-effectiveness )， 
成 本 -效益 (cost-benefit) 以 及 成 本 - 效用 (cost-utility )， 并 进行 比较 和 评价 ， 分 析 它 们 可 产 出 的 社 
会 效益 及 经 济 效益 , 以 肯定 那些 成 本 既 低 , 其 效果 又 佳 的 研究 成 果 , 使 之 能 推广 应 用 。 

(三 ) 研究 成 果 的 适用 性 (applicability) 

临床 研究 往往 是 以 解决 革 种 ( 些 ) 重 大 疾病 的 早期 正确 诊断 以 及 有 效 防 治 或 改善 疾病 预后 
等 为 其 目的 的 , 因此 , 它们 的 针对 性 是 颇 为 明确 的 。 因 此 ,对 于 研究 成 果 的 实用 性 , 要 分 析 它们 

了 无 实用 价值 有 多 大 的 实用 价值 , 利弊 比 有 多 大 , 在 什么 样 的 医疗 环境 和 条 件 下 可 以 采用 或 

推广 , 宣 作 实事 求 是 的 估价 。 切 不 可 脱离 自己 的 环境 技术 条 件 和 病人 的 实际 情况 , 盲目 地 接受 
或 推行 。 
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(四 ) 真实 性 、 重 要 性 和 适用 性 评价 在 循 证 医学 中 的 具体 应 用 : 系统 评价 

循 证 医学 的 重要 目的 是 利用 现 有 的 临床 研究 的 成 果 作 为 证 据 去 解决 临床 问题 , 但 是 如 何 寻 
找 和 鉴别 成 果 的 科学 性 、 真 实 性 和 为 临床 医师 自己 诊治 病人 所 应 用 , 临床 医师 和 临床 研究 工作 
者 必须 掌握 上 述 的 临床 流行 病 学 的 设计 、 测 量 和 评价 的 研究 方法 学 , 同时 还 需要 掌握 对 大 量 的 
相关 临床 研究 信息 进行 定性 合成 和 定量 合成 的 系统 评价 的 方法 学 , 以 适应 解决 临床 问题 的 需要 。 

事实 上 , 在 信息 爆炸 的 时 代 , 面 对 发 表 的 浩瀚 海洋 般 的 文献 资料 , 临床 医师 要 掌握 本 专业 
的 新 技术 、 新 方法 和 新 进展 的 研究 成 果 , 即使 不 间断 地 阅读 本 专业 的 文献 , 也 难以 全 面 、 准 确 地 
把 握 。 同 时 , 即使 针对 临床 的 同一 个 问题 , 我们 通过 检索 会 吃惊 地 发 现 , 可 能 会 有 大 量 的 进行 
过 相关 研究 而 发 表 的 文献 ,但 是 结果 和 结论 不 尽 相同 或 相近 , 甚至 截然 相反 。 例 如 , 生长 抑 素 
和 其 衍生 物 对 胰腺 外 科 临 床 常见 的 术 后 胰 瘘 并 发 症 的 预防 , 甚至 前 瞻 性 的 随机 对 照 研究 的 结果 
和 结论 对 其 预防 胰 瘘 作用 的 评估 也 是 不 同 的 。 类 似 的 问题 在 其 他 研究 中 也 常常 见 到 , 这 就 提出 
一 个 问题 即 临 床 医师 如 何 科学 地 面 对 这 些 不 尽 相同 或 相互 矛盾 的 信息 , 进行 科学 .系统 的 甄别 ， 
为 临床 决策 提供 高 质量 的 、 综 合 性 正确 的 证 据 。 因 此 , 迫切 需要 一 种 科学 的 方法 全 面 收集 相关 
的 文献 ,并 进行 严格 的 评价 分析 和 合成 , 去 伪 存 真 , 力求 真实 可 靠 的 结论 为 临床 实践 服务 , 这 
就 是 循 证 医学 的 重要 方法 之 一 的 系统 评价 (systematic review )- 系统 评价 的 方法 可 以 为 临床 医师 
和 卫生 部 门 提供 了 做 出 决策 所 需要 的 大 量 科 学 信息 。 因 此 , 系统 评价 是 真实 性 、 重 要 性 和 实用 
性 评价 在 循 证 医学 中 的 具体 应 用 。 

但 是 我 们 应 该 清楚 , 系统 评价 本 身 是 一 种 方法 学 , 具有 双 刃 剑 的 性 质 。 如 果 应 用 得 当 、 采 
方法 正确 , 通过 对 相关 的 临床 研究 成 果 进 行 严 格 的 评价 、 分 析 和 合成 , 可 以 达到 解决 多 个 研 
究 结论 不 一 致 的 问题 , 为 临床 决策 提供 正确 和 科学 的 证 据 。 如 果 方 法 不 恰当 , 二 次 研究 的 结论 
可 能 提供 的 是 不 正确 的 信息 , 误导 临床 的 决策 过 程 。 如 一 些 做 定量 合成 的 meta 分 析 , 由 于 收集 
的 相关 研究 不 全 面 或 使 用 的 临床 研究 的 结果 不 可 靠 , 所 做 出 的 二 次 研究 即 系统 评价 的 结论 难免 




















。 受到 多 种 偏 倚 因 素 的 影响 而 与 实际 情况 不 符 。 因 此 , 系统 评价 的 方法 正确 与 否 可 直接 影响 到 结 


论 的 真实 性 和 可 靠 性 (参见 本 教材 第 七 章 )。 
第 五 节 ”临床 流行 病 学 与 循 证 医学 对 临床 医学 的 作用 与 价值 


一 、 临 床 流行 病 学 为 临床 医学 研究 提供 科学 的 方法 学 . 催生 高 质量 的 成 果 

临床 流行 病 学 的 诞生 和 发 展 弥补 了 传统 临床 研究 方法 的 缺陷 和 不 足 , 对 促进 临床 研究 水 平 
的 进步 和 产生 高 质量 的 研究 成 果 , 为 临床 循 证 医学 实践 和 提高 医疗 质量 服务 。 

临床 研究 的 最 新 成 果 , 特别 是 高 质量 的 成 果 , 可 能 成 为 指导 临床 实践 和 防治 疾病 的 重要 工 
具 和 手段 ,许多 研究 成 果 如 今 已 经 作为 指导 临床 诊断 、 治 疗 和 预防 的 最 佳 证 据 (best evidence )， 
诸如 一 些 重要 的 临床 诊治 指南 的 治疗 建议 均 是 以 现代 的 高 质量 的 研究 成 果 作 为 基础 。 据 世 
界 卫生 组 织 统计 , 全 球 每 年 投入 的 卫生 研究 经 费 逾 700 多 亿美 元 ; 我 国政 府 在 “十 一 五 ”和 
“十 二 五 ”国家 重大 疾病 防治 研究 领域 , 均 大 大 加 强 了 经 费 投 入 ,期 望 能 通过 加 强 卫生 研究 , 产 
出 高 质量 的 研究 成 果 以 促进 防 病 治 病 的 水 平 。 根 据 “ 十 一 五 ” 国家 重大 疾病 防治 攻关 课题 的 质 
量 分 析 , 近 30%~40% 的 课题 因为 研究 设计 方法 学 的 缺陷 严重 地 影响 了 研究 的 质量 , 是 为 教训 。 
所 以 一 旦 人 研究 课题 确立 后 , 应 用 临床 流行 病 学 的 理论 、 原 则 和 方法 来 规范 和 指引 研究 是 成 功 的 
关键 之 一 。 

临床 流行 病 学 指导 临床 研究 , 设计 了 一 种 效应 环 的 原理 , 首先 通过 调查 了 解 有 关 疾 病 对 国 
家 和 人 民 造 成 的 疾病 负担 程度 (burden of disease, BOD ), 以 掌握 危害 人 类 健康 的 重大 疾病 ; 从 特 
定 群 体 的 角度 针对 它们 发 病 的 病因 和 危险 因素 , 采取 针对 性 的 有 效 防 治 措施 , 并 不 断 地 总 结 其 
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效率 和 效果 ; 通过 研究 实践, 收集 有 关 研 究 成 果子 以 综合 评价 和 进一步 地 改进 ,再 付 诸 实践, 最 
后 验证 疾病 危害 人 类 健康 的 疾病 负担 减轻 的 程度 。 在 这 样 一 个 循环 效应 下 , 要 不 断 地 创造 新 方 
法 、 新 经 验 、 新 措施 、 新 成 果 . 服务 于 临床 医学 。 

二 、 循 证 医学 促进 临床 实践 .提高 医疗 水 平 

21 世纪 的 科学 技术 的 快速 发 展 , 特别 是 信息 技术 、 生 命 科学 技术 的 突飞猛进 , 推动 着 医学 
及 人 类 健康 水 平 的 提高 。 众 多 新 的 药物 、 新 的 治疗 方法 、 新 的 诊断 技术 不 断 地 问世 , 并 消 向 临 
床 医学 领域 。 临 床 医师 如 何 选择 这 些 新 的 技术 、 新 的 方法 和 药物 为 病员 服务 , 面临 的 不 仅仅 是 
机 遇 , 也 是 挑战 。 因 为 新 的 技术 和 新 的 方法 以 及 新 的 治疗 药物 众多 , 多 数 的 确 可 以 提高 临床 诊 
治水 平 , 促进 临床 医学 水 平 的 进步 , 使 病人 获 益 ; 少数 非但 无 效 , 并 可 能 给 患者 带 来 严重 的 不 
良 反 应 、 并 发 症 或 使 病人 延误 诊断 和 治疗 ; 还 有 一 些 曾 被 认为 有 临床 价值 且 被 普遍 接受 的 治疗 
措施 或 药物 , 后 经 严格 的 临床 研究 证 明 是 无 效 或 无 益 的 。 因 此 , 临床 医生 如 何 从 众多 新 成 果 中 
去 辨别 丰 伪 , 以 提高 自己 临床 诊治 水 平 ,对 此 ,临床 流行 病 学 和 循 证 医学 提供 了 对 疾病 病因 、 诊 
断 、 治 疗 及 预后 的 一 系列 评价 的 原则 、 标 准 与 方法 。 

循 证 医学 对 临床 工作 的 推进 表现 在 两 个 方面 , 一 是 通过 对 现 有 的 临床 研究 成 果 进 行 检索 、 
系统 评价 .meta 分 析 等 , 获得 对 指导 临床 工作 真正 有 益 和 有 用 的 证 据 ; 二 是 从 临床 诊断 、 治 疗 、 
预防 .预后 .不 良 反应 、 经 济 分 析 、 生 存 质量 、 卫 生 技术 和 医疗 质量 评估 等 具体 的 临床 工作 中 人 
手 , 围绕 具体 问题 , 进行 循 证 医学 实践 解决 这 些 问题 。 

三 、 临 床 流行 病 学 与 循 证 医学 服务 于 医学 教育 、 培 养 高 质量 的 人 才 

临床 流行 病 学 和 循 证 医学 的 精 角 是 培养 医学 生 从 事 临床 医学 研究 和 临床 医疗 实践 中 的 科 
学 的 学 术 , 批判 性 、 创 造 性 、 科 学 性 思维 , 掌握 临床 研究 与 实践 的 基本 理论 、 知 识 和 方法 以 及 养 
成 严谨 的 研究 和 工作 素养 , 为 今后 从 事 临床 研究 和 临床 实践 打下 基础 , 这 对 培养 高 质量 、 高 素 
质 的 医学 生 , 使 之 在 毕业 后 的 临床 医疗 实践 中 , 更 好 地 做 好 临床 医疗 和 科研 工作 , 对 于 发 展 和 
提高 临床 医学 的 水 平 具有 重要 的 战略 意义 。 














( 刘 续 宝 ”王家 良 ) 








第 二 音 ” 临床 研究 与 实践 问题 的 构建 


临床 医师 在 临床 实践 中 经 常会 遇 到 许多 需要 解决 的 实际 问题 , 如 针对 某 个 患者 应 该 选择 哪 
项 检查 才能 比较 准确 地 诊断 或 排除 某 个 疾病 ? 应 该 进行 何 种 治疗 才能 更 好 地 改善 这 个 患者 的 
预后 ? 实际 上 , 临床 医师 对 患者 的 诊治 过 程 就 是 一 个 不 断 提出 问题 , 寻找 最 佳 的 解决 方法 , 直至 
最 后 解决 问题 的 过 程 。 这 样 的 问题 ,我们 称 之 为 临床 实践 问题 。 对 患者 实践 循 证 医学 (evidenece 
based medicine, EBM ) 的 第 一 步 就 是 找 出 一 个 需要 解决 的 实际 问题 ,将 其 构建 成 为 一 个 需要 回 
答 的 临床 实践 问题 。 因 此 , 能 否 找 准 患者 或 须 解决 的 实际 问题 , 对 于 临床 实践 循 证 医学 至 关 
重要 。 
男 一 方面 , 临床 医师 在 进行 临床 研究 时 需要 通过 研究 回答 一 个 科学 问题 , 如 某 个 疾病 的 病 
或 危险 因素 是 什么 ? 影响 这 个 疾病 预后 的 因素 有 哪些 ? 这 样 的 问题 , 我们 称 之 为 临床 研究 
问题 。 构 建 一 个 恰当 的 科学 问题 是 开展 科学 研究 的 第 一 步 , 它 对 临床 研究 也 同样 有 十 分 重要 的 
作用 。 
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第 一 节 概 述 


一 、 找 出 临床 问题 的 重要 性 

(一 ) 实施 循 证 医学 的 第 一 步 

临床 医师 应 该 善于 在 临床 实践 中 对 上 患者 进行 观察 ,发 现 问题 并 提出 问题 。 只 有 提出 问题 
后 , 临床 医师 才 会 带 着 问题 去 寻找 相关 的 证 据 , 而 后 根据 可 信 度 最 强 的 证 据 并 结合 自己 的 临床 
经 验 、 患 者 的 意愿 等 因素 提出 恰当 .合理 的 解决 方案 ,最终 解决 临床 问题 并 使 患者 获 益 。 因 此 ， 
找 出 问题 是 临床 实践 循 证 医学 的 起 点 , 找 不 准 问题 就 不 可 能 提出 恰如其分 的 临床 实践 问题 。 
一 步 走 不 好 , 必 将 影响 循 证 医学 实践 中 后 续 步骤 的 实施 。 构 建 一 个 恰当 的 临床 实践 问题 ,可 
帮助 临床 医师 更 好 地 制定 寻找 证 据 的 策略 , 有 效 地 收集 .评价 证 据 , 最 终 回答 和 解决 这 个 临床 
问题 。 如 果 没 有 相应 的 证 据 或 收集 到 的 证 据 科学 性 不 强 时 , 临床 医师 可 以 将 这 个 临床 实践 问题 
转化 成 为 临床 科学 问题 , 从 而 进一步 提出 研究 计划 并 加 以 实施 , 通过 临床 研究 回答 这 个 临床 问 
题 ,为 临床 实践 提供 证 据 。 

(二 ) 医学 发 展 的 需要 

有 的 临床 医师 认为 自己 在 医学 院 学 到 的 知识 足以 回答 临床 实践 中 的 所 有 问题 而 不 再 需要 
继续 学 习 , 这 种 想法 是 错误 的 。 在 临床 实践 中 , 如果 临 床 医师 不 能 结合 患者 的 实际 情况 提出 有 
意义 的 临床 问题 , 不 去 查阅 文献 .寻找 和 评价 最 新 的 证 据 , 不 对 自己 的 临床 知识 进行 更 新 , 患者 
就 不 可 能 得 到 最 好 的 诊断 和 治疗 。 作 为 研究 者 , 如 果 临 床 医师 对 临床 实践 不 进行 思考 和 总 结 ， 
临床 医学 也 不 可 能 取得 进步 。 随 着 医学 进步 与 发 展 , 针对 某 个 临床 问题 的 答案 是 会 发 生变 化 
的 ,对 一 个 临床 问题 的 认识 不 断 升 华 才 能 使 之 逐渐 接近 真实 。 
如 , 在 诊断 学 教科 书 中 ， 黄 冶 加 胆囊 无 痛 性 肿 大 即 Courvoisier 征 一 直 被 作 为 胰 头 瘤 的 重 
要 体征 介绍 给 学 生 ,但 这 是 不 是 一 个 一 成 不 变 的 定律 呢 ” 用 该 体征 诊断 胰 头 癌 是 否 敏 感 而 且 
特异 呢 ? 这 是 诊断 学 教科 书 所 没有 提 到 的 。 回 答 这 个 问题 需要 对 瑞士 外 科 医 生 Courvoisier 于 
1890 年 提出 的 该 体征 进行 重新 评价 。 临 床 观 察 发 现 , 该 体征 在 早期 胰 头 f 不 常见 ; 进 一 
步 的 研究 发 现 , 该 体征 鉴别 良 恶性 胆道 梗阻 的 价值 并 不 高 (阳性 似 然 比 2.6), 部 分 患 胆 石 症 的 
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患者 也 可 以 出 现 该 体征 。 此 外 , 该 体征 诊断 肝 外 胆道 梗阻 性 黄 益 的 敏感 度 也 较 低 (37%), 所 以 
Courvoisier 征 阴性 时 也 不 能 排除 胰 头 癌 的 诊断 。 从 目前 临床 实践 的 情况 看 , 该 体征 对 诊断 胰 头 
癌 的 临床 价值 是 较 低 的 , 这 可 能 是 100 多 年 来 医学 诊断 技术 进步 的 结果 。 随 着 医学 影像 学 技术 
的 发 展 , B 超 、CT、MR .ERCP 和 超声 内 镜 在 临床 实践 中 得 以 广泛 应 用 , 许多 胰 头 癌 患 者 在 出 现 
Courvoisier 征 之 前 就 已 经 获得 了 正确 的 诊断 。 

临床 医学 是 一 门 实践 科学 , 临床 医师 只 有 在 临床 实践 中 不 断 地 提出 问题 并 通过 临床 研究 回 
答 所 提出 的 问题 , 才能 促使 临床 医学 不 断 发 展 进 步 。 

(三 ) 循 证 医学 所 赋予 的 任务 

循 证 医学 以 解决 与 患者 锻 患 疾病 相关 的 重要 临床 问题 为 核心 , 因此 临床 医生 在 临床 实践 中 
必须 抓 住 患者 身上 关键 的 临床 问题 。 这 些 问题 往往 关系 到 患者 的 生死 安危 , 而 临床 医师 如 果 仅 
依靠 自己 的 临床 知识 和 经 验 常常 难以 准确 地 回答 这 些 问 题 。 临 床 医师 必须 以 这 些 问题 为 主线 ， 
按照 循 证 医学 的 步骤 收集 和 评价 以 往 的 临床 研究 , 选择 最 佳 的 证 据 回答 和 解决 所 面临 的 关键 临 
床 问题 。 可 以 说 , 循 证 医学 的 第 一 关键 是 找 准 患者 身上 存在 的 、 临 床 医师 必须 回答 的 关键 临床 
问题 。 

















二 、 找 准 临 床 问题 应 具备 的 条 件 


(一 ) 临床 责任 心 

对 患者 有 高 度 责任 感 、 关 心 患者 、 同 情 患者 的 医生 , 会 以 患者 为 中 心思 考 问 题 , 能够 在 与 患 
者 的 交流 中 观察 并 发 现 重 要 的 临床 问题 。 

(二 ) 丰富 的 医学 基础 知识 和 临床 医学 知识 

人 体 各 个 系统 的 疾病 都 有 其 自身 的 客观 规律 , 临床 医师 如 果 不 了 解 疾病 的 病因 、 发 病 机 制 
和 临床 表现 , 不 熟悉 各 种 诊断 试验 和 辅助 检查 的 特性 和 适应 证 , 不 了 解 各 种 药物 的 治疗 机 制 、 
药理 作用 和 可 能 发 生 的 不 良 反应 ,那么 当 他 (她 ) 碰 到 一 个 具体 的 患者 时 就 不 可 能 提出 恰当 的 临 
床 问题 。 因 此 , 具备 系统 扎实 的 医学 基础 知识 和 临床 知识 是 找 准 临床 问题 的 重要 基础 。 

(三 ) 具有 一 定 的 人 文科 学 及 社会 心理 学 知识 

随 着 医学 模式 的 改变 , 人 们 发 现 许多 疾病 的 发 生 与 心理 、 精 神 因素 有 关 。 也 有 一 些 疾病 的 
发 生 虽 与 此 关系 不 大 , 如 慢性 肝病 .肿瘤 等 , 但 患者 对 疾病 的 认识 和 心态 会 影响 疾病 的 发 展 和 
预后 。 因 此 , 临床 医师 不 仅 要 了 解 患者 对 疾病 的 想法 、 期 望 及 忧虑 , 也 要 了 解 患者 的 社会 经 济 
状况 和 家 庭 负 担 等 , 这 样 做 有 利于 发 现 这 方面 的 临床 问题 。 临 床 医师 也 只 有 掌握 一 定 的 人 文科 
学 、 社 会 和 心理 学 知识 , 才能 与 不 同性 格 的 患者 顺利 地 进行 沟通 , 发 现 患者 的 心理 问题 并 帮助 
加 以 解决 ,其 本 身 也 是 疾病 治疗 的 一 部 分 。 

(四 ) 扎实 的 临床 基本 技能 

包括 如 何 接触 患者 、 采 集 病史 、 全面 的 体格 检查 以 及 对 诊断 试验 选择 和 鉴别 的 能 力 。 临 床 
医师 在 临床 实践 中 必须 弄 清 患者 的 病史 、 认 真 详细 地 进行 体格 检查 、 掌 握 相关 的 辅助 检查 结果 。 
在 此 前 提 下 , 临床 医师 才 可 能 找 出 患者 最 迫切 需要 解决 的 临床 问题 。 

(五 ) 临床 综合 分 析 能 力 和 判断 能 力 

临床 医师 应 用 已 掌握 的 医学 理论 知识 和 临床 经 验 , 结合 患者 的 临床 资料 进行 综合 分 析 、 逮 
辑 推理 , 从 错综复杂 的 线索 中 去 伪 存 真 、 去 粗 取 精 , 找 出 实践 中 的 主要 矛盾 并 加 以 解决 , 这 反映 
出 临床 医师 的 综合 分 析 能 力 和 判断 能 力 , 是 准确 把 握 临床 问题 的 必 备 条 件 。 

上 述 五 点 是 寻找 和 提出 临床 问题 的 重要 必 备 条 件 , 缺 一 不 可 。 缺 少 其 中 任何 一 点 都 不 利于 
找 准 患 者 的 临床 问题 。 
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第 二 节 ”如 何 构 建 临 床 循 证 问题 


一 、 临 床 问 题 的 类 型 

从 医学 生 直至 高 年 资 临 床 医生 都 可 以 进行 临床 研究 以 及 参与 循 证 医学 实践 活动 ,但 鉴于 他 
们 的 经 验 、 阅 历 不 一 , 视角 与 水 平 不 同 , 即使 在 临床 实践 中 面 对 同一 个 患者 , 其 发 现 和 提出 的 临 
床 问题 (clinical question ) 也 会 大 不 一 样 。 这 些 问 题 大 致 可 归纳 为 以 下 三 个 方面 : 

(一 ) 一 般 性 问题 

主要 由 初学 循 证 医学 的 实践 者 提出 , 这 些 问题 大 多 属于 “背景 性 " 问题 。 如 : 

1. 涉及 患者 的 一 般 知 识 性 问题 ”如 患者 的 性 别 、 年 龄 等 。 

2. 涉及 所 患 疾病 的 基本 问题 某 个 具体 患者 存在 的 临床 问题 , 如 在 什么 地 方 、 何 种 环境 下 


| 发病、 何 时 发 病 、 如 何 发 病 及 发 病 的 相关 因素 是 什么 、 主 要 的 临床 表现 是 什么 等 。 


(二 ) 特殊 的 临床 问题 

这 是 临床 医师 在 诊治 患者 的 过 程 中 , 特别 是 充分 掌握 病史 、 体征、 相关 检查 结果 之 后 ,通过 
临床 综合 分 析 从 专业 角度 找到 的 问题 。 一 般 称 为 “前 景 性 " 问题: 

1. 个 体 患者 存在 的 特殊 问题 这 些 问题 不 解决 则 必然 影响 对 患者 的 正确 处 理 。 例 如 , 一 
个 肝 硬化 患者 近期 腹水 明显 增多 , 对 其 提出 “腹水 有 无 感染 "就 是 一 个 十 分 重要 的 临床 问题 , 如 
果 不 能 确定 是 否 合并 自发 性 腹膜 炎 , 就 无 法 对 其 进行 正确 的 治疗 。 

2. 干预 ”如何 进行 干预 往往 涉及 病因 、 危 险 因素 的 暴露 、 诊 断 治疗、 预后、 患者 对 病情 的 





| 理解 及 依从 性 等 。 例 如 , 对 一 个 消化 性 溃疡 患者 进行 治疗 时 , 必须 先 针对 病因 提出 问题 , 包括 患 
| 者 有 无 幽门 螺杆 菌 感染 有 无 服用 非 当 体 抗 炎 药 病史 、 有 无 应 激 状 态 等 ， 这 些 都 影响 到 治疗 方案 





的 选择 ; 对 慢性 活动 性 病毒 性 肝炎 患者 的 治疗 , 其 对 病情 的 理解 及 依从 性 就 更 显得 格外 重要 。 

3. 干预 措施 的 选择 ”同一 个 疾病 的 干预 措施 往往 有 许多 种 , 每 一 种 措施 又 各 有 利 浆 ,这 时 
就 存在 如 何 比较 抉择 干预 措施 的 问题 。 例 如 ,对 恶性 肿瘤 患者 是 采取 手术 还 是 介入 性 治疗 或 放 
化 疗 , 不 仅 要 根据 病情 进行 分 析 , 将 各 种 干预 措施 的 利弊 进行 比较 , 还 要 考虑 到 患者 的 经 济 能 
力 以 及 与 患者 及 家 属 沟通 的 结果 。 

4. 干预 的 最 后 结局 ”这 是 循 证 医学 的 实践 者 追求 最 佳 结局 最 感 兴趣 的 问题 。 结 局 可 以 是 
症状 、 体 征 的 改善 或 者 生存 率 、 死 亡 率 和 致 残 率 , 使 用 不 同 的 结局 指标 找 出 的 问题 也 不 尽 相同 。 

总 之 , 以 上 四 个 环节 是 一 个 有 机 整体 , 循 证 医学 的 实践 者 在 发 现 临床 问题 时 一 定 要 将 其 牢 
牢 掌握 。 

(三 ) 患者 关心 的 问题 

应 该 结合 患者 的 具体 情况 提出 问题 。 例 如 , 吹 患 同一 个 疾病 但 年 龄 不 同 的 患者 所 关心 的 装 
题 是 不 同 的 。 一 项 有 1012 名 乳腺 癌 妇 女 参加 的 研究 发 现 , 70 岁 以 上 的 妇女 最 关心 的 是 癌症 治 
您 和 转移 的 可 能 性 , 而 小 于 50 岁 的 妇女 关心 的 是 治疗 对 其 性 功能 的 影响 ; 有 阳性 家 族 史 的 妇女 
最 关心 的 是 该 病 是 否 有 遗传 性 等 。 因 此 , 临床 医师 应 针对 不 同 患 者 的 不 同情 况 提出 临床 需要 多 
决 的 问题 。 

















二 、 提 出 临床 问题 的 形式 和 方法 
(一 ) 提出 临床 问题 的 形式 
现在 许多 医学 院 校 已 经 开展 “以 问题 为 中 心 的 学 习 (problem-based learning,PBL), 这 里 的 
“问题 (problem ”是 指 患 者 存在 的 一 种 症状 或 体征 , 如 黄 着 、 腹 水 、 胸 痛 等 。 本 文 所 指 的 “临床 问 
题 是 一 个 可 以 回答 (answerable ) 的 问题 (question), 如 “为 这 个 黄姜 患者 选择 辅助 检查 时 , 腹部 
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B 超 和 CT 哪 一 项 更 好 ?”。 尽 管 “problem” 和 “question” 均 可 翻译 成 “问题 ”但 两 者 的 内 涵 完 全 
不 同 。 下 面 讨论 提出 临床 问题 (question ) 的 形式 。 

1. 一 般 性 临床 问题 一 般 性 问题 是 与 患者 或 患者 钼 患 疾病 有 关 的 一 般 知 识 性 问题 , 由 以 
下 两 部 分 构成 : 

(1) 问题 由 疑问 词 ( 谁 、 什 么 、 何 时 、 何 地 、 怎 么 样 、 为 什么 ) 加 动词 构成 : 这 些 问 题 的 答案 在 
患者 人 院 时 常常 可 以 通过 询问 病史 和 体格 检查 得 到 。 例 如 , 每 一 个 主诉 都 应 该 包括 症状 发 生 的 
部 位 、 严 重 程度 、 数 量 (如 出 血 量 )、 起 病情 况 (急性 还 是 慢性 、 持 续 性 还 是 进展 性 )、 在 什么 情况 
下 发 生 、 加 重 和 缓解 的 因素 以 及 其 他 关联 症状 等 ,了 解 以 往 是 否 发 生 过 与 主诉 相同 的 情况 , 曾 
经 做 过 哪些 检查 , 是 否 曾经 做 过 治疗 以 及 如 何 治疗 , 对 预后 有 意义 或 对 治疗 有 影响 的 既往 史 ， 
相关 疾病 的 治疗 情况 等 。 如 以 呕血 为 动词 时 , 就 必须 弄 清楚 是 谁 呕血 (患者 的 性 别 、 年 龄 等 特 
征 )、 哎 血 的 性 质 (颜色 、 量 、 次 数 等 )、 何 时 何 地 发 生 哎 血 、 哎 血 时 患者 有 无 其 他 症状 以 及 什么 是 
发 生 呕 血 的 主因 、 诱 因 及 其 基本 病变 等 。 

(2) 问题 涉及 一 种 疾病 或 疾病 的 某 一 方面 : 例如 ,“ 什 么 原因 引起 发 热 ?”“ 急 性 胰腺 炎 通 常 
在 何 时 发 生 并 发 症 ?” 等 。 

2. 特殊 性 的 临床 问题 “在 临床 实践 中 , 患者 与 医生 都 会 在 诊断 、 治 疗 、 预 后 、 预 防 ,病因 等 
各 个 方面 提出 许多 需要 解决 的 临床 问题 。 例 如 , 患者 常常 会 问 医生 “我 患 的 是 什么 病 ?”( 诊 断 问 
题 )、 “我 为 什么 会 患 这 个 病 ?”( 病 因 问 题 )、“ 这 个 病 应 该 用 什么 方法 进行 治疗 ?”( 治 疗 问题 )、“ 这 
”个 病 对 我 的 健康 有 多 大 影响 , 会 不 会 影响 我 的 寿命 (预后 问题 )。 医 生 在 诊治 不 同 疾病 或 同一 
个 疾病 的 不 同 患者 时 , 提出 的 问题 可 能 各 不 相同 , 归纳 起 来 包括 以 下 几 个 方面 : 

(1) 患者 本 次 住院 或 门诊 就 诊 时 需要 解决 的 问题 以 及 住院 后 因 病 情 变 化 而 产生 的 新 问题 : 
临床 医师 可 以 对 患者 发 生 的 每 一 个 症状 或 体征 提出 问题 。 例如 , 上述 呕血 的 患者 在 就 诊 时 阴 须 
解决 的 主要 问题 是 及 时 止血 并 弄 清 呕 血 的 原因 ; 出 血 停 止 后 患者 出 现 计 算 力 下 降 、 昼 夜 颠倒 、 
扑 旨 样 吉庆 等 表现 , 这 时 患者 亚 须 解决 的 主要 问题 就 变 成 了 天 清 是 否 出 现 肝 伺 脑病 并 对 此 采取 
积极 的 治疗 措施 。 也 可 以 在 准确 采集 病史 和 体检 的 过 程 中 发 现 并 提出 新 的 问题 。 例 如 ,一 位 中 
年 男性 因 发 现 黄 盖 就诊 ， 临床 医师 在 体检 时 发 现 无 痛 而 肿 大 的 胆 赛 ( Courvoisier 征 ), 提出 的 问 
题 即 可 为 “该 体征 对 于 梗阻 性 黄 冶 和 肝 细 胞 性 黄 冶 的 鉴别 诊断 是 否 有 意义 ” ,进一步 可 提问 “其 
对 于 鉴别 肝 外 梗阻 的 原因 ， 即 结石 引起 抑或 肿瘤 引起 , 是 否 有 帮助 "等 。 

(2) 诊断 方面 的 问题 : 初学 者 在 诊断 方面 常 提出 的 问题 是 某 个 症状 、 体 征 或 某 项 辅助 检查 对 
某 个 疾病 的 诊断 价值 , 即 关于 诊断 试验 的 敏感 度 、 特 异 度 及 似 然 比 等 问题 ; 而 有 多 年 临床 工作 经 
验 的 医师 常 提出 的 问题 是 某 项 检查 对 鉴别 诊断 的 意义 。 通 过 询问 病史 和 体格 检查 , 临床 医师 会 有 
一 个 诊断 假设 。 为 了 证 实 该 假设 ， 医生 可 能 会 进行 一 些 实验 室 检查 或 其 他 辅助 检查 来 肯定 或 排除 
该 诊断 假设 ， 此 时 可 以 针对 诊断 试验 的 敏感 度 .特异 度 、 伺 然 比 等 提出 问题 , 针对 其 正确 性 、 可 千 
性 、 可 接受 性 、 费 用 及 安 全 性 等 方面 也 可 提出 问题 。 例如 , 上 述 黄 冶 患 者 的 体征 (Courvoisier 征 
阳性 ) 及 鉴别 诊断 所 采取 的 B 超 、CT、MRCP 等 辅助 检查 均 可 视 为 诊断 试验 而 提出 相应 的 问题 。 
再 比如 , 对 一 个 呕血 的 患者 为 了 寻找 出 血 的 部 位 和 原因 是 否 应 作 和 急诊 胃镜 检查 ? 仅 此 一 点 
就 可 以 提出 许多 临床 问题 , 如 “急诊 胃镜 检查 对 诊断 上 消化 道 出 血 的 敏感 度 和 特异 度 如 何 ?”“ 急 
浴 胃 镜 检 查 对 该 思考 带 来 的 风险 有 多大 ?”" 对 肝 硬 化 患者 和 非 肝 硬 化 患者 带 来 的 利和 册 有 无 关 
jp“ 急诊 四 错 检查 的 诊断 结果 是 否 会 影响 医生 对 治疗 方案 的 选择 ?”““ 有 无 其 他 可 供 选择 的 诊 
断 措施 ?" 等 等 。 

在 选择 诊断 试验 前 ,还 可 以 对 患者 的 验 前 概率 , 即 患 者 在 没有 进行 此 项 诊断 检查 前 患 该 病 
的 可 能 性 大 小 提出 问题 。 例 如 ， 上 述 呕 血 的 患者 在 没有 做 急诊 胃镜 检查 前 , 由 食管 静脉 破裂 出 
血 引 起 呕血 的 概率 是 多 大 ? 这 与 患者 的 基本 情况 有 关 。 如 果 这 位 患者 有 肝 硬 化 病史 , 则 食管 静 
脉 破裂 出 血 的 可 能 性 较 大 ; 如 果 以 前 有 过 类 似 的 出 血 史 , 且 胃 镜 已 证 实 是 由 食管 静脉 曲张 破裂 
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引起 , 则 其 验 前 概率 就 更 高 。 根 据 验 前 概率 可 提出 问题 , 如 “急诊 胃镜 检查 的 结果 是 否 影响 对 
该 患者 所 采取 的 治疗 措施 ?" 反 之, 如 果 该 患者 无 肝 硬 化 病史 但 长 期 服用 阿司匹林 , 则 其 因 食管 
静脉 破裂 出 血 的 概率 就 较 小 , 而 急诊 胃镜 的 结果 可 以 用 来 证 实 或 排除 食管 静脉 破裂 出 血 , 其 诊 
断 结果 对 患者 治疗 方案 的 选择 影响 较 大 。 此 外 , 如 果 已 经 对 患者 做 出 了 初步 诊断 , 还 可 以 提出 
能 否 通过 某 项 诊断 试验 确定 该 病 的 严重 程度 ?”“ 用 何 种 指标 来 测量 随访 患者 在 治疗 后 的 改善 
情况 ?” 等 问题 。 

(3) 治疗 方面 的 问题 : 如何 选择 利 大 于 雌 的 治疗 手段 ? 如何 从 经 济 学 成 本 - 效果 的 角度 先 
择 治疗 方案 ? 特别 有 意义 的 是 针对 目前 的 常规 疗法 提出 质疑 , 如 “根据 患者 目前 的 病情 可 以 采 
用 什么 治疗 方法 ?”“ 该 治疗 方法 的 有 效 性 如 何 ?”“ 有 什么 不 良 反应 ?”“ 还 有 什么 可 以 替代 的 治疗 
手段 ?”“ 哪 一 种 治疗 方法 更 为 有 效 而 花费 最 少 ?" “该 治疗 对 患者 的 生存 质量 有 何 影响 ?” “治疗 对 
患者 的 预后 影响 如 何 ?”“ 患 者 对 治疗 的 依从 性 和 可 接受 性 如 何 ?” 等 等 。 上 述 胰腺 癌 患 者 可 以 根 
据 疾病 的 严重 度 选 用 外 科 手 术 或 姑息 疗法 。 如 果 采 用 后 者 , 为 了 减轻 黄姜 的 危害 及 提高 生存 质 
量 , 可 以 通过 内 镜 放置 内 支架 引流 减轻 胆道 梗阻 。 可 以 进一步 提出 的 问题 有 "安置 金属 支架 , 还 
是 塑料 支架 ,何者 为 佳 ?”“ 为 加 强 支持 治疗 是 否 给 予 患者 静脉 内 营养 ?" 等 等。 

对 于 食管 静脉 破裂 出 血 的 肝 硬 化 患者 , 在 出 血 停止 后 为 了 预防 再 次 出 血 , 可 以 选择 外 科 分 
流 或 断 流 手 术 治疗 、 内 镜 下 圈套 或 注射 硬化 剂 治疗 , 口服 B- 受 体 阻 尘 剂 治疗 介入 治疗 等 。 这 
时 ,必须 根据 患者 的 具体 情况 将 这 些 措施 预防 再 出 血 的 效果 、 风险、 后 遗 症 、 疗 程 以 及 对 生存 的 
影响 、 费 用 等 逐 项 列 出 进行 比较 选择 , 在 找到 证 据 后 临床 医师 应 结合 患者 的 病情 提出 建议 , 并 
在 征求 患者 意见 的 基础 上 做 出 决策 。 

(4) 病因 方面 的 问题 : 包括 “怎样 识别 疾病 的 原因 及 危险 因素 ?”“ 其 发 病 机 制 是 什么 2” 等 等。 
例如 , 对 于 胰腺 癌 患 者 可 以 提出 的 病因 问题 包括 “发病 的 原因 是 什么 ?”“ 有 无 遗传 因素 ?”" 发 生 
胰腺 癌 的 危险 因素 是 什么 2" “是否 与 喝 咖 啡 或 饮酒 有 关 2” 等 等 。 

(5) 预后 方面 的 问题 : 如 何 估计 患者 的 临床 病程 ”如 何 预测 可 能 发 生 的 并 发 症 和 最 后 结局 ? 
针对 不 同 的 结局 测定 指标 可 以 提出 不 同 的 预后 问题 。 例 如 , 上 述 预 防 食管 静脉 破裂 再 出 血 的 干 
预 措施 对 “再 出 血 的 发 生 率 "和 “患者 的 生存 率 ” 两 种 预后 指标 是 否 有 不 同 的 效果 ? 

(二 ) 提出 临床 问题 的 方法 

临床 医师 在 临床 实践 中 遇 到 患者 存在 的 问题 , 想 解决 却 存在 知识 、 能 力 不 足 时 , 就 要 找 准 
问题 并 记录 下 来 ,通过 自己 的 临床 思维 对 其 进行 整理 和 排序 , 先 抓 好 关键 问题 并 做 出 如 何 解决 
这 个 ( 些 ) 问 题 的 策略 计划 , 有 的 放 矢 地 查阅 文献 .进行 文献 评价 并 选择 最 佳 证 据 来 解决 患者 的 
问题 。 在 提出 临床 问题 的 方法 上 ,要 掌握 的 是 : @ 涉 及 的 问题 一 定 与 患者 的 诊断 、 治 疗 和 预后 
密切 相关 ; @ 涉 及 的 问题 一 定 与 临床 实践 循 证 医学 、 提 高 医疗 水 平 最 为 相关 ; @ 涉 及 的 问题 一 
定 是 临床 实践 中 最 有 用 , 也 是 最 重要 的 ; @ 涉 及 的 问题 往往 也 是 临床 实践 循 证 医学 中 最 为 党 
见 的 。 

如 果 御 证 医学 的 实践 者 在 平时 的 临床 工作 中 对 各 种 不 同 患者 的 临床 问题 能 够 做 到 日 积 月 
累 并 不 断 用 最 佳 证 据 予 以 解决 ,终身 坚持 , 必 成 名 家 , 并 且 也 会 对 循 证 医学 做 出 巨大 贡献 。 

(三 ) 针对 患者 的 实际 情况 提出 问题 

上 述 两 种 类 型 的 问题 几乎 包括 了 所 有 需要 提出 的 临床 问题 (question)。 对 学 生 而 言 ,前 一 
类 一 般 性 的 背景 问题 可 能 多 一 些 ; 对 有 经 验 的 临床 医师 来 讲 , 后 一 类 前 景 问题 可 能 多 一 些 。 有 
些 问 题 不 需要 进一步 查 资 料 就 可 以 回答 , 但 就 教学 而 言 , 有 必要 让 学 生 了 解 如 何 针对 患者 的 实 
际 情况 提出 可 回答 问题 。 

为 了 进一步 了 解 患 者 的 情况 (一 般 性 问题 ) 和 对 患者 进行 进一步 处 理 (特异 性 问题 ), 在 上 









































述 工作 的 基础 上 可 以 开 出 教育 处 方 (educational prescription ), 即 提出 患者 坡 须 解决 的 临床 问题 


(question), 以 进一步 寻找 答案 。 教 育 处 方 提出 的 可 回答 问题 必须 十 分 具体 。 例 如 , 在 讨论 一 位 
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重症 胰腺 炎 患 者 的 治疗 措施 时 , 不 能 提 类 似 于 “重症 胰腺 炎 患 者 该 如 何 治疗 ?” 这 样 的 问题 。 因 
为 问题 太 过 宽泛 , 如 果 据 此 去 检索 文献 , 会 有 上 千 篇 文 章 , 最 终 无 法 归纳 总 结 出 回答 该 问题 的 
答案 。 因 此 , 提出 的 问题 必须 要 具体 到 某 一 项 措施 , 如 有 人 提出 “对 重症 胰腺 炎 患 者 是 否 需要 
静脉 内 营养 或 肠 内 营养 "的 问题 , 结合 患者 实际 就 可 以 这 样 提 出 问题 : “全 胃 肠 外 营养 和 肠 内 
营养 对 于 急性 重症 胰腺 炎 在 降低 感染 发 生 率 、 减 少 并 发 症 发 生 率 、 缩 短 住院 时 间 和 降低 死亡 率 
方面 , 哪 一 种 方法 较 好 ?” 为 了 回答 这 个 问题 , 可 以 用 检索 词 “parental nutrition or TPN and enteral 
nutrition and acute severe pancreatitis” 检索 文献 ， 寻找 答案 。 由 此 可 见 , 构建 的 问题 必须 包括 对 象 
( 某 种 疾病 、 症 状 或 患者 ) 和 需要 比较 的 措施 , 这 样 查找 出 来 的 结果 , 才能 对 临床 医师 决策 有 所 
帮助 。 

(四 ) 为 临床 科研 提出 问题 

临床 实践 是 临床 科研 选 题 的 丰富 源泉 , 在 日 常 临床 实践 中 临床 医师 无 时 无 刻 不 面 对 许多 关 
于 诊断 、 治 疗 、 病 因 、 预 后 等 方面 的 问题 , 不 少 诊断 方法 和 治疗 手段 也 有 待 进一步 的 科学 评价 。 
从 临床 需要 出 发 提出 问题 , 用 可 靠 的 方法 进行 研究 ,得 到 可 靠 的 证 据 回答 所 提出 的 问题 , 最 终 
指导 他 人 的 临床 实践 。 
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三 、 构 建 临床 循 证 问题 的 模式 


在 构建 一 个 具体 的 临床 问题 时 , 可 采用 国际 上 常用 的 PICO 格式 。P 指 特定 的 患 病 人 群 
( population/participants ;证 指 干 预 (intervention/exposure ), C 指 对 照 组 或 另 一 种 可 用 于 比较 的 干预 
措施 (comparatorcontrol )， 0 为 结局 (outcome )。 每 个 临床 问题 均 应 由 PICO 四 部 分 构成 。 下 图 显 
示 了 3 个 临床 问题 的 组 成 方式 : 人 对 于 慢性 肾 功能 衰竭 尿毒 症 患者 , 肾脏 移植 与 血液 透析 相 比 






































在 生存 率 和 生存 质量 上 哪 种 方法 更 好 ? @ ACEI 与 CCB 合用 与 单 用 CCB 相 比 , 在 保护 肾 功能 、 
降低 血压 和 减少 尿 蛋 白 方 面 是 否 有 更 好 的 效果 ? @@ 对 于 频 发 的 尿 路 感染 , 长 期 小 剂量 应 用 抗 生 
素 是 否 能 预防 复发 ”根据 PICO 确定 关键 词 , 便于 检索 ( 表 2-1)。 
表 2-1 临床 问题 的 组 成 PICO 
Patient/Population Intervention/Exposure Comparator/Control Outcomes 
慢性 肾 功 能 误 竟 肾脏 移植 血液 透析 能 否 改善 患者 生存 质量 和 生 
尿毒 证 存 率 
慢性 肾病 ore CCB 保护 肾 功能 、 降 低 血压 、 减 
少 尿 蛋白 
频 发 尿 路 感染 长 期 小 剂量 抗生素 空白 对 照 预防 复发 


总 之 , 要 提出 一 个 好 的 临床 问题 , 需要 具备 系统 扎实 的 基础 与 临床 专业 知识 和 技能 , 深入 
临床 实践 , 善于 思考 , 跟踪 本 专业 的 研究 进展 , 学 会 从 患者 的 角度 加 以 考虑 , 才能 提出 和 构建 良 
好 的 临床 问题 。 


第 三 节 ”临床 研究 中 如 何 选 题 与 立 题 


临床 研究 的 目的 在 于 探索 人 类 疾病 发 生 、 发 展 和 转 归 的 规律 , 提高 对 疾病 的 诊断 和 防治 水 
平 , 消除 或 减轻 疾病 对 人 体 的 危害 , 改善 预后 , 提高 人 类 的 健康 水 平 。 由 于 危害 人 类 健康 的 疾 
病 众多 , 造成 的 疾病 负担 程度 各 异 , 对 疾病 的 病因 和 发 病 机 制 的 认识 程度 的 差异 , 诊断 与 防治 
背 施 的 效果 不 一 等 , 造成 了 临床 医学 的 复杂 性 。 此 外 , 由 于 当代 经 济 的 全 球 化 、 科 学 技术 以 及 
信息 技术 的 快速 发 展 , 人 们 对 自身 健康 质量 的 关注 以 及 对 防 病 治 病 的 要 求 越 来 越 高 。 因 此 , 如 
何 选择 与 确立 具有 重要 意义 的 课题 进行 研究 , 是 具有 挑战 性 的 重大 问题 。 临 床 研究 应 遵循 国家 
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的 卫生 工作 方针 与 政策 , 以 预防 为 主 、 防 治 结合 , 改善 人 民 的 健康 , 促进 我 国 临床 医学 事业 的 兴 
旺 发 达 , 从 而 也 有 利于 社会 安定 和 国家 经 济 建设 的 发 展 。 


、 临 床 研究 的 特点 


临床 医学 的 研究 不 同 于 基础 医学 的 实验 性 研究 , 也 有 异 于 预防 医学 的 群体 健康 性 研究 , 其 
特点 表现 为 以 下 几 个 方面 : 

(一 ) 研究 对 象 是 患者 

临床 研究 的 对 象 是 患者 , 患者 是 有 关 疾 病 的 “载体 "。 震 患 疾病 的 患者 都 饱 受 疾病 的 折磨 ， 
忍受 着 不 同 程度 的 痛苦 , 承受 着 肉体 、 精 神 及 经 济 等 方面 的 压力 , 同时 由 于 各 自 的 病理 生理 特 
点 ,心理 情感 状态 ,文化 水 平 及 所 处 自然 与 社会 环境 的 差异 , 疾病 的 临床 过 程 和 情况 十 分 复杂 ， 
即使 同一 种 疾病 的 病理 损害 相似 , 患者 的 临床 表现 却 往往 有 十 分 显著 的 个 体 差异 , 这 就 形成 了 
临床 研究 对 象 的 复杂 性 。 因 此 , 临床 研究 对 象 务必 要 符合 有 关 疾 病 的 诊断 标准 , 同时 研究 者 还 


， 要 制定 恰当 的 纳入 与 排除 标准 , 使 研究 对 象 具有 相对 匀 质 性 , 从 而 有 利于 研究 的 可 比 性 。 


(二 ) 干预 措施 要 安全 有 效 

任何 开展 临床 试验 的 治疗 药物 或 治疗 措施 包括 诊断 性 措施 , 一 定 要 有 临床 试验 前 的 科学 依 
据 , 证 明 对 患者 具有 安全 性 以 及 对 疾病 诊治 具有 有 效 性 , 方 可 进行 立 题 研究 。 例 如 , 新药 的 临 
床 治疗 试验 , 一 定 要 有 药物 化 学 成 分 、 药 效 学 依据 、 病 理 与 毒 理 、 药 物 代谢 动力 学 等 可 靠 的 基础 
医学 实验 研究 以 及 一 期 临床 试验 证 据 , 证 明 其 安全 有 效 且 符合 相关 的 法 律 法 规 方 可 立 题 进行 正 











。 式 的 临床 试验 。 因 此 , 对 于 缺乏 科学 依据 是 无 疗效 证 据 的 药物 或 “措施 "是 不 允许 用 患者 做 试验 


研究 的 。 为 了 对 比 新 的 试验 措施 或 药物 的 疗效 , 需要 设立 对 照 组 , 而 对 照 组 的 研究 措施 也 要 保 
证 患者 的 安全 性 。 安 奈 剂 应 根据 治疗 性 试验 的 具体 情况 和 要 求 使 用 。 

(三 ) 医院 是 主要 的 研究 场所 

临床 研究 主要 是 在 医院 范围 内 进行 , 但 是 当 涉及 病因 或 危险 因素 的 致 病 效应 、 疾 病 的 早期 

诊断 以 及 疾病 的 早期 治疗 或 一 .二 级 预防 时 , 则 要 面向 社区 筛选 具有 临床 前 期 或 仅 有 晤 期 轻微 

临床 表现 而 尚 能 正常 工作 的 患 病 群体 进行 研究 。 这 种 包括 医院 内 和 医院 外 患者 的 综合 性 群体 
人 研究 ,具有 临床 与 流行 病 学 研究 的 双重 属性 , 也 是 临床 研究 的 一 个 发 展 方向 。 
(四 ) 遵循 医学 伦理 的 要 求 
按照 世界 医学 协会 关于 人 体 临床 试验 的 赫尔辛基 宣言 要 求 , 凡是 以 人 体 为 研究 对 象 的 临床 














| 研究 , 所 使 用 的 试验 药品 或 措施 , 都 必须 具有 充分 的 科学 依据 , 要 安全 ` 有效 , 保证 无 损 于 患者 


的 利益 。 对 于 接受 试验 的 患者 , 要 明确 地 解释 接受 治疗 或 试验 措施 的 目的 、 意 义 及 可 能 发 生 的 
副作用 。 坚持 自愿 的 原则 , 尊重 患者 的 人 格 , 不 欺瞒 研 究 对 象 。 如 果 患 者 接受 试验 , 则 需要 签 
署 知情 同意 书 , 以 防 日 后 发 生 争议 。 即 使 在 试验 进程 中 , 患者 也 有 退出 的 权利 。 因 此 , 任何 涉 
及 以 患者 为 研究 对 象 的 临床 试验 , 在 正式 立 题 研究 时 要 高 度 注意 医学 伦理 问题 , 必须 向 有 关机 
构 的 伦理 委员 会 申请 , 接受 伦理 委员 会 的 审查 , 通过 后 方 可 进行 研究 。 


二 、 选 题 与 立 题 的 原则 

尽管 国家 各 级 村 机 确定 的 科研 课 是 上 标 六 南 为 友 者 提供 了 研究 方向 和 可 选课 是 研究 人 
然 再 要 等 握 临床 研究 选 题 , 立 题 的 原则 , 方 能 充分 发 挥 科研 人 员 的 积极 性 和 创造 性 。 

(一 ) 选择 重大 疾病 进行 研究 

从 疾病 负担 的 调查 与 分 析 中 , 选择 高 发 病 率 .高 致 残 率 、 潜 在 减 寿 年 数 (potential years of life 
lost, PYLL ) 或 伤 残 调整 寿命 年 ( disability adjusted life year, DALY ) 损 失 大 的 、 造 成 疾病 负担 重 、 
对 社会 安定 影响 大 、 贡 地 的 疾病 为 重点 课题 进行 研究 , 如 恶性 肿瘤 、 脑 血管 疾病 、 呼 
吸 系统 疾病 以 及 心血 管 疾病 、 急 性 传染 病 、 人 兽 共 患 病 .新 生 儿 疾病 等 疾病 负担 十 分 突出 的 国 
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家 确定 的 重点 防治 疾病 。 

人 体 暴露 于 致 病因 素 后 具有 不 同 的 易 感 性 和 抵抗 力 , 因此 应 将 高 危 人 群 列 为 重点 防治 研究 
的 对 象 。 例 如 : 吸烟 者 多 为 肺癌 发 病 的 高 危 人 群 ; 乙 型 肝炎 病毒 感染 致 慢性 肝炎 者 为 肝癌 发 病 
的 高 危 人 群 ; 高 血压 、 糖 尿 病 、 高 脂 血 症 等 患者 为 心 脑 血管 病 的 高 危 人 群 ; 环境 ,水源 与 食物 污 
染 严 重 的 地 区 , 往往 是 肿瘤 高 发 区 和 高 危 人 群 所 在 的 地 区 等 。 

随 着 社会 进步 和 医学 发 展 , 疾病 谱 、 病 原生 物体 及 其 疾病 负担 在 不 断 地 发 
的 认识 总 是 落后 于 不 断 变化 的 客观 现实 , 这 就 要 求 研究 者 不 停顿 地 去 研究 与 探 
究 重点 的 选择 也 必然 会 发 生变 动 。 例 如 , 在 新 中 国 成 立 初期 , 鼠疫 、 德 乱 和 天 花 
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化 ,而 人 们 
。 相 应 地 , 研 
等 急性 、 烈 性 传 















监控 为 主 。 随 着 经 济 发 展 科 人 民生 活水 平 的 提高 .生活 节奏 的 加 快 、 生 态 环境 的 变化 , 肿瘤 和 
心 脑 血 管 病 等 非 传染 性 疾病 逐渐 上 升 为 我 国 主要 的 健康 问题 . 这 时 临床 研究 的 选 题 就 应 随 着 国 




















家 的 人 民 疾 病 负担 状况 的 改变 而 与 之 相 适应 。 此 外 ,我 国 幅员 辽阔 、 人 口 众多 , 各 地 区 的 自然 、 
社会 和 经 济 环境 有 着 显著 的 差异 , 疾病 谱 及 疾病 的 负担 也 存在 地 区 性 的 差异 。 因 此 , 防 病 治 病 
的 选 题 也 就 有 着 地 方 特点 , 各 个 地 区 都 有 相应 的 研究 重点 。 例 如 , 南方 有 关 省 区 的 血吸虫 病 、 
广东 地 区 的 鼻 咽 癌 、 河 南 林 县 及 四 川 盐 亭 地 区 的 食管 癌 等 均 为 所 在 地 区 的 研究 重点 。 
国家 重大 疾病 防治 研究 课题 的 选择 与 决策 除了 依靠 专家 的 积极 性 外 , 根据 一 些 先进 的 国际 
经 验 , 还 应 吸收 有 关 卫 生 医 疗 人 员 、 行 政 管理 人 员 和 社区 的 人 民 代表 参与 , 共同 讨论 , 以 听取 各 
方面 的 意见 和 建议 , 从 科学 性 和 防 病 治 病 的 现实 需要 性 等 多 个 维度 进行 综合 分 析 , 方 能 做 出 符 
合 中 国 国情 的 防 病 研 究 的 科学 决策 。 

(二 ) 研究 问题 要 具体 、 明 确 

选择 研究 课题 , 首要 的 是 确定 研究 的 焦点 , 即 具体 和 明确 地 提出 期 望 要 解决 的 问题 。 例 如 ， 
艾滋 病 的 防治 研究 被 选 定 为 国家 的 重点 课题 , 它 所 涉及 的 问题 十 分 广泛 , 如 病因 及 发 病 的 危险 
因素 、 诊 断 、 治 疗 .预后 及 预防 研究 等 。 从 临床 研究 的 角度 出 发 , 研究 的 重点 应 当 是 探索 有 效 的 
防治 措施 和 改善 患者 预后 的 方法 , 这 是 目前 迫切 需要 解决 的 实际 问题 。 任 何 具体 的 研究 要 想 一 
揽 子 地 去 研究 和 解决 全 部 问题 , 往往 是 不 现实 的 。 因 此 , 一 定 要 根据 自己 的 基础 、 专 业 特长 、 兴 
趣 爱 好 .工作 条 件 、 技 术 力量 和 经 济 支持 等 , 实事 求 是 地 选择 某 一 个 关键 问题 去 重点 研究 , 绝 不 
能 在 一 个 研究 中 企图 去 解决 多 个 问题 , 否则 极 易 造 成 困难 的 局 面 , 达 不 到 预期 的 月 的 。 

如 果 属 于 综合 性 的 重大 课题 , 由 于 涉及 的 内 容 和 研究 方法 不 同 , 可 以 根据 研究 的 具体 内 容 ， 
以 主 课题 为 中 心 设立 若干 分 课题 ( 子 课题 ) 开 展 研究 。 分 课题 是 主 课题 的 一 部 分 , 与 主 课题 
相连 。 各 个 分 课题 的 有 机 综合 就 构成 了 总 课题 的 研究 整体 。 

(三 ) 创新 性 

研究 课题 的 选择 , 要 有 自主 创新 性 , 有 新 的 见解 和 新 的 特色 , 而 不 是 跟着 别人 去 盲目 地 重 
复 或 赶 “ 时 瞩 "。 课 题 涉 及 的 内 容 , 应 力求 居于 该 领域 的 研究 前 沿 并 具有 领先 水 平 , 或 者 在 过 去 
研究 的 基础 上 有 所 突破 和 改进 , 如 采用 现代 科学 技术 ， 在 分 子 生 物 学 水 平 上 研究 候选 基因 、 基 
因 多 态 性 与 疾病 发 生 的 联系 , 应 用 蛋白 质 组 学 技术 探讨 靶 向 药物 有 可 能 取得 比 以 往 组 织 .细胞 
水 平 的 研究 更 为 精确 的 结果 。 即 使 对 于 重大 疾病 防治 措施 的 研究 , 也 应 前 析 婚 往 或 现在 有 效 干 
预 的 最 佳 水 平 , 寄 希望 于 有 新 的 突破 , 否则 就 会 造成 人 力 、 物 力 和 财力 的 损失 和 浪费 , 且 人 研究 本 
身 也 往往 没有 什么 意义 。 

(四 ) 公正 性 

临床 研究 应 面向 广大 人 民 群 众 亟待 解决 的 健康 问题 。 中 国 作为 世界 上 最 大 的 发 展 中 国家 ， 
国内 不 同 地 区 的 经 济 发 展 水 平 存在 着 巨大 差异 , 社会 贫 富 差 距 也 颇 为 显著 ,城乡 医疗 卫生 和 保 
健 事业 的 水 平 也 很 不 同 。 因 此 , 临床 研究 课题 的 选择 , 应 该 结合 我 国 的 国情 、 地 方 特点 天 
民 (不 分 贫 富 ) 对 促进 健康 和 有 效 防治 疾病 的 要 求 进行 考虑 , 以 充分 体现 临床 全 究 的 社会 公 
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另 一 方面 , 国家 和 地 方 的 卫生 研究 经 费 投入 是 有 限 的 , 人 力 资源 与 水 平 也 受 某 些 客观 因素 
的 限制 。 因 此 在 选择 临床 研究 课题 的 时 候 , 应 该 考虑 将 有 限 的 资源 投入 到 最 需要 解决 的 、 关 系 
大 多 数 人 民 健康 的 方面 , 以 体现 卫生 研究 资源 利用 的 社会 公正 性 。 

(五 ) 选择 足够 的 研究 对 象 

对 疾病 病因 及 危险 因素 的 研究 , 要 有 足够 的 接触 和 不 接触 暴露 因素 的 观察 对 象 ; 诊断 及 防 
治 试验 也 要 计算 研究 所 需求 的 最 低 样 本 数量 。 在 选 题 的 时 候 , 一 定 要 根据 实际 情况 充分 考虑 研 
究 对 象 的 来 源 和 数量 。 如 果 一 个 地 区 或 单位 在 规定 期 间 内 有 足够 的 研究 对 象 来 参与 研究 , 则 该 
研究 可 行 , 否则 需要 考虑 组 织 具有 相同 或 相似 水 平 的 地 区 、 单 位 进行 多 中 心 协 作 , 以 保证 该 研 
究 对 样本 量 的 需求 。 临 床 试验 所 采用 的 新 措施 或 新 药物 都 有 研发 时 间 限 制 ,期 望 尽 可 能 快 地 验 
证 其 临床 效果 和 应 用 价值 。 如 果 因 研究 对 象 来 源 不 足 而 导致 试验 时 间 延 长 , 就 有 可 能 被 更 新 的 
研究 药物 或 措施 所 取代 , 造成 原 试 验 研究 失去 时 效 性 甚至 原 有 的 价值 。 如 果 研 究 对 象 十 分 充 
足 , 则 可 视 具体 情况 从 特定 人 群 或 医院 患者 群体 中 按 设计 要 求 随机 抽样 获得 最 终 进 入 试验 的 研 
究 对 象 。 

(六 ) 合理 的 研究 设计 方案 

根据 立 题 研究 的 课题 性 质 , 抉择 科学 性 及 可 行 性 良好 的 设计 方案 是 保障 研究 课题 获得 成 功 
的 关键 之 一 。 

(七 ) 干预 措施 要 安全 有 效 

选择 任何 干预 措施 和 诊断 方法 进行 研究 , 都 要 确保 其 安全 有效。 即使 对 目前 尚 无 有 效 治 








| 疗 的 疾病 进行 治疗 性 试验 , 该 试验 药物 或 措施 也 要 有 科学 依据 , 特别 是 药 效 学 的 实验 依据 。 研 


究 要 有 先进 性 和 创新 性 , 否则 就 没有 研究 的 必要 。 

( 八 ) 执行 研究 措施 的 可 行 性 

选 题 的 时 候 , 对 拟 采 用 的 研究 措施 一 定 要 考虑 执行 的 可 行 性 。 

1. 仪器 设备 及 实验 室 条 件 ”试验 研究 的 措施 及 试验 结果 , 都 需要 相应 的 仪器 设备 进行 测 
试 。 例 如 : 涉及 抗生素 或 化 学 治疗 药物 的 耐 药性 基因 或 肿瘤 病因 学 的 研究 有关 抑 瘤 或 致癌 基 
因 的 研究 都 需要 具备 分 子 生物 学 实验 的 仪器 设备 和 实验 条 件 , 否则 即使 研究 的 问题 选 得 好 , 客 
观 上 却 不 可 行 。 

2. 要 有 执行 研究 课题 的 配套 人 才 “要 有 一 支 具备 科研 设计 、 实 施 和 观察 .资料 收集 .统计 
分 析 及 研究 总 体 指导 和 管理 等 技术 力量 的 较 强 专业 队伍 , 这 是 保证 选 题 立 题 后 能 够 执行 的 重要 
条 件 。 

3. 干预 措施 和 测试 的 指标 一 定 不 能 过 繁 ”采取 的 试验 干预 措施 或 药物 在 剂型 用法、 用 药 
的 途径 等 方面 应 力求 简单 易 行 。 测 试 效应 的 指标 不 应 过 多 , 在 保证 准确 可 靠 的 前 提 下 选用 灵敏 
性 和 特异 性 好 的 指标 , 做 到 少 而 精 既 可 以 保证 执行 的 可 行 性 , 也 可 以 减少 假 阳性 或 假 明 性 偏 倚 
的 影响 , 避免 误导 研究 的 结果 和 结论 。 

4. 注意 社会 、 文 化 和 宗教 等 的 可 接受 性 ”临床 试验 主要 是 以 患者 作为 研究 对 象 , 因此 要 注 
意 社 会 习俗 文化 素养 以 及 宗教 信仰 等 因素 及 临床 试验 措施 的 可 接受 性 , 否则 就 可 能 产生 负面 
影响 。 

5. 注意 研究 对 象 的 依从 性 ”即使 一 种 很 好 的 防 病 治 病 措施 , 如 果 价格 过 贵 或 应 用 方法 过 
楷 或 对 患者 缺少 足够 的 解释 及 关爱 , 则 研究 对 象 的 依从 性 往往 无 法 得 以 保证 ,研究 者 在 研究 课 

( 九 ) 经 费 支 持 

在 选 题 和 立 题 时 , 研究 者 务必 要 考虑 经 费 的 来 源 与 保障 , 实事 求 是 地 预算 研究 经 费 , 保证 
仪器 设备 、 实验 试剂 .药品 开支 、 劳 务 报酬 和 学 术 交 流 等 必需 的 费用 。 不 切实 际 (过 高 或 过 低 ) 
地 预算 经 费 是 不 利于 所 立 课题 的 正常 运作 的 。 
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(十 ) 伦理 学 原则 

任何 临床 研究 课题 的 立 题 ,务必 要 符合 伦理 学 的 原则 , 遵守 国际 公认 的 赫尔辛基 宣言 的 精 
神 。 按照 国 际 惯例 , 临床 试验 的 研究 课题 必须 经 过 有 关机 构 的 科研 伦理 委员 会 审查 通过 后 方 有 
资格 立 题 研究 。 

(十 一 ) 预测 研究 成 果 的 价值 

研究 者 要 根据 科学 的 依据 对 选择 和 立 题 研 究 的 课题 可 能 获得 的 科学 成 果 、 防 病 治 病 的 效果 
和 价值 进行 实事 求 是 的 预测 , 估计 其 成 本 - 效果、 是否 会 被 推广 应 用 以 及 可 能 产生 的 社会 效益 
及 经 济 效 益 等 。 这 些 因 素 及 指标 对 于 选 题 申 报 具 有 很 重要 的 参考 价值 。 

三 、 临 床 选 题 和 立 题 的 程序 

(一 ) 研究 问题 的 提出 与 选 题 
临床 研究 问题 的 提出 , 离 不 开 防 病 治 病 的 具体 实践 。 当 在 临床 医学 实践 中 发 现 了 某 种 不 易 
解释 的 临床 现象 或 某 种 疾病 严重 地 威胁 人 类 的 健康 时 , 必然 促使 人 们 要 去 探索 其 病因 及 发 病 的 
危险 因素 , 弄 清楚 诊断 , 为 有 效 地 防治 提供 科学 的 依据 ; 当 某 些 疾病 对 患者 造成 巨大 的 负担 而 
缺乏 有 效 治疗 对 策 的 时 候 , 就 会 迫使 临床 学 家 和 基础 医学 学 科 及 药学 专家 们 去 研究 发 据 有 效 的 
防治 药物 与 措施 , 以 挽救 患者 ; 对 某 些 难 治 的 、 预 后 不 良 的 急性 或 慢性 疾病 , 往往 会 激励 临床 学 
家 去 研究 一 些 改善 预后 的 措施 以 减轻 病 残 , 降低 病死 率 和 改善 患者 的 生存 质量 。 人 们 的 认识 会 
在 这 个 过 程 中 逐步 地 深化 和 完善 , 从 而 找 准 研究 的 课题 和 解决 的 重点 。 

新 间 题 的 出 现 , 成 为 人 们 去 研究 和 解决 的 动机 。 从 多 种 认识 中 去 比较 分 析 , 去 粗 存 精 、 弃 
伪 存 真 , 以 选 出 最 重要 、 最 能 影响 全 局 的 问题 去 研究 , 这 就 是 从 提出 的 问题 中 进行 选 题 研究 的 
主要 过 程 。 

为 了 有 助 于 对 选 题 的 理解 , 这 里 以 艾滋 病 的 研究 为 例 。 众 所 周知 , 艾滋 病 是 20 世纪 末 威 
胁 全 人 类 健康 的 重大 问题 之 一 , 据 2003 年 底 WHO 报告 艾滋 病 (HIV ) 感 染 者 , 全 球 达 4000 余 万 
人 ,发 病 者 达 500 万 人 ,死亡 者 达 300 余 万 人 。 当 今世 界 投入 研究 的 资源 是 十 分 惊人 的 。 从 临 
床 病例 的 发 现 , 对 患者 的 病例 - 对 照 研究 和 流行 病 学 调查 , 弄 清 了 该 病 的 传播 途径 和 发 病 的 危 
险 因素 。 在 此 基础 上 ,病毒 学 和 免疫 病 学 家 的 研究 , 发 现 了 致 病 的 人 类 免疫 缺陷 病毒 (HIV ), 导 
致 患者 的 免疫 功能 严重 损害 , 成 为 继 发 感染 和 致 瘤 的 原因 , 相继 为 艾滋 病 的 特异 性 诊断 提供 了 
有 力 的 武器 ; 发 病 机 制 的 阐明 对 临床 病征 的 解释 和 治疗 提供 了 科学 的 依据 。 尽 管 如 此 , 临床 却 
缺乏 有 效 的 治疗 手段 。 生 物 医 学 家 们 正 全 力 地 研究 治疗 的 药物 , 以 期 挽救 患者 生命 并 改善 预 
后 。 在 预防 研究 方面 ,疫苗 的 研制 与 应 用 、 针 对 发 病危 险 因 素 的 干预 难度 很 大 , 涉及 社会 经 济 、 
精神 文明 和 道德 行为 的 方方面面 。 诸 多 未 解决 的 问题 , 需要 医学 家 及 社会 学 家 从 中 选择 研究 ， 
一 一 突破 和 解决 。 这 就 是 对 艾滋 病 的 研究 及 其 需要 解决 的 重点 问题 。 

又 如 2002 年 底 至 2003 年 初 从 我 国 发 生 的 严重 急性 呼吸 综合 征 (SARS), 导致 国内 及 国际 
上 部 分 地 区 的 传播 , 经 WHO 组 织 国际 合作 研究 确定 病原 为 变异 的 冠状 病毒 。 尽 管 全 球 的 病例 
仅 8000 多 例 , 但 其 病死 率 高 (5%~10%), 影响 甚大 。 当 前 重点 是 研究 该 病 的 特异 性 的 早期 诊断 
方法 以 及 有 效 的 防治 措施 , 改善 患者 的 预后 , 这 些 是 吸 待 解决 的 重大 课题 。 因 此 , 国际 卫生 研 
究 发 展 委员 会 (COHRED ) 提 出 卫生 研究 的 选 题 原 则 , 强调 两 点 : 一 为 国家 重大 的 疾病 ; 二 为 这 
种 疾病 对 全 球 人 民 的 健康 具有 重要 的 影响 。 对 具有 这 两 方面 特点 的 疾病 应 重点 选 题 进行 研究 。 
因此 , 这 些 原则 与 事例 可 作为 研究 者 选 题 的 参考 。 

(二 ) 充分 掌握 现 有 的 科技 信息 

人 们 的 认识 水 平和 临床 经 验 是 十 分 有 限 的 。 当 出 现 陌 生 或 不 易 解释 的 临床 现象 , 或 者 发 生 
了 某 种 未 知 疾病 , 临床 医学 家 必须 回答 这 些 挑战 性 的 问题 。 这 些 问 题 , 可 能 是 医学 领域 里 的 未 
知 现象 , 或 者 是 不 太 清楚 的 事件 , 也 可 能 是 自己 不 知 而 他 人 已 知 的 事件 。 因 此 .除了 应 用 自己 










































































第 二 章 “临床 研究 与 实践 问题 的 构建 


的 聪明 才智 之 外 , 要 带 着 问题 去 认真 地 检索 医学 文献 , 充分 掌握 科技 信息 资料 , 认真 进行 分 析 
以 了 解 被 研究 问题 的 历史 、 现 状 以 及 尚 待 探讨 的 关键 问题 。 抓 住 了 矛盾 与 问题 , 则 应 进一步 地 
追寻 采用 什么 样 的 研究 方法 去 研究 解决 这 类 具有 挑战 性 的 问题 。 

在 查阅 文献 的 时 候 , 一 定 要 采用 临床 流行 病 学 / 循 证 医学 的 原则 和 方法 ,进行 严格 的 科学 
分 析 和 评价 , 吸收 有 充分 科学 依据 、 真 实 性 和 水 平 高 的 文献 精华 : 抛弃 有 偏 倚 因 于 和 的 、 缺 
乏 科 学 依据 的 文献 。 这 样 , 对 研究 课题 的 选择 才 不 至 于 发 生 误导 。 这 里 要 十 分 强调 : 好 的 文献 
并 不 一 定 都 是 阳性 的 结果 , 阴性 的 研究 结果 并 不 意味 着 是 质量 差 的 文献 ,标准 取决 于 文献 的 直 
实 性 . 

为 研究 选 题 而 查阅 文献 , 要 充分 地 应 用 现代 科学 的 检索 手段 和 方法 ,针对 型 
可 能 收集 高 度 相关 、 高 质量 的 文献 加 以 借鉴 ,切忌 视野 狭窄 . 主观 片面 .草率 从 事 .结论 也 

(三 ) 确定 研究 的 关键 问题 

由 于 人 的 精力 和 时 间 是 有 限 的 , 应 根据 学 术 力 量 、 知 识 的 水 平 .研究 的 基础 和 人 研究 的 具体 
条 件 从 诸多 需要 解决 的 问题 中 , 参照 有 关 选 题 的 原则 , 选择 研究 的 关键 和 切实 可 行 的 重大 研究 
问题 立 题 研究 。 对 此 , 要 实事 求 是 , 要 估计 研究 成 功 的 把 握 度 , 以 充满 信心 地 完成 研究 任务 , 达 
到 预期 的 目的 。 这 里 切记 的 是 不 要 贪 多 求全 , 企图 通过 一 个 研究 课题 来 解决 许多 个 问题 , 实践 
证 明 这 样 的 想法 和 做 法 , 都 是 脱离 实际 的 。 

(四 ) 撰写 研究 计划 书 

立 题 后 , 应 按 一 定 规范 格式 和 内 容 , 撰写 科研 计划 书 。 详 见 本 教材 第 十 六 章 。 

、 临 床 研究 立 题 的 评价 标准 

对 于 临床 研究 立 题 的 评价 , 有 以 下 参考 标准 供 研究 者 考虑 : 

(一 ) 是 否 为 国家 或 地 区 性 危害 人 民 健 康 的 重大 疾病 

这 里 要 考虑 社会 的 需求 性 、 注 重 国家 或 地 区 性 疾病 负担 的 现 况 , 要 重视 对 危害 人 民 健 康 重 
大 的 疾病 研究 ; 要 考虑 考虑 社会 的 公正 性 , 即 临床 研究 能 为 大 多 数 人 服务 。 当 然 . 还 要 结合 研 
究 考 和 全 究 机 构 的 实际 水 平 与 研究 的 能 力 , 实事 求 是 地 为 国家 或 地 区 有 效 防治 重大 疾病 、 研 究 
创新 方面 作 贡献 

(二 ) 研究 的 重点 是 否 明确 

一 个 科研 课题 应 有 明确 的 研究 重点 , 即 重点 要 解决 的 关键 问题 。 例 如 : 对 SARS 特异 性 早 

期 诊断 研究 , 重点 究竟 是 什么 ?是 分 离 病毒 确诊 或 是 应 用 特异 性 抗体 检查 早期 患者 的 病毒 搞 

































原 ? 还 是 检验 SARS 患者 血 中 的 抗体 ”方法 是 什么 ”是 否 准确 可 信 ? 预期 价值 如 何 ? 这 些 问题 
应 明确 回答 , 方 可 论证 研究 的 重点 。 





一 个 研究 课题 , 若 涉及 的 问题 面 宽 , 想 通过 一 个 研究 解决 多 方面 的 问题 , 必然 缺乏 重点 ,其 
结果 也 不 会 达到 预期 的 目的 。 

(三 ) 是 否 掌握 了 本 研究 涉及 的 最 新 科技 信息 和 发 展 动态 

立 题 人 研究 与 确立 癸 究 的 重点 , 务必 要 通过 检索 文献 资料 , 查阅 与 掌握 相关 的 最 新 科技 信息 ， 
这 是 避免 无 效 重复 及 使 得 自己 掌握 最 新 知识 , 力求 创新 的 最 为 重要 的 环节 。 应 力争 完善 并 对 新 
知识 做 到 严格 评价 , 取 其 精华 . 弃 其 糟粕 , 掌握 可 靠 的 最 新 最 佳 证 据 方 能 在 探索 中 继往开来 , 使 

立 题 研究 更 具 时 效 性 、 科 学 性 。 

(四 ) 是 否 具有 创新 性 

一 个 好 的 研究 课题 , 务必 要 有 自主 性 的 创新 性 , 重复 他 人 的 “研究 ”" 是 缺乏 生命 力 的 ,如 像 
有 的 研究 人 员 从 国外 引进 一 点 技术 或 试剂 , 照 人 家 的 方法 在 国内 找 一 些 患 者 采集 一 些 标本 ,做 
一 下 人 家 做 过 的 试验 , 获得 某 种 结果 , 包括 分 子 生物 学 的 “研究 结 ei 尽管 在 国内 筑 
首次 , 但 算 不 上 “自主 创新 ”, 因为 毕竟 是 重复 人 家 的 ,创新 应 该 是 自己 真正 的 创造 ， 此外. 亦 应 
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避免 育 目 地 与 国际 “接轨 ”和 脱离 国情 的 “ 追 新 "! 所 以 在 创新 上 应 认真 鉴别 , 尽管 创新 难 .但 在 
研究 工作 方面 又 确 属 重要 。 

(五 ) 是 否 具有 可 行 性 

对 课题 承担 与 执行 者 的 学 术 技术 力量 .工作 基础 、 设 备 条 件 、 研 究 设计 的 方案 和 路 线 .干预 
措施 .研究 对 象 的 来 源 和 数量 上 的 保障 以 及 经 费 的 预算 , 是 否 可 行 .要 仔细 评价 : 

(六 ) 预期 的 成 本 -效果 

这 里 要 考核 研究 课题 预期 可 能 产生 的 效果 。 例 如 提高 诊断 的 水 平 、 提 高 疗 放 水平 . 降低 病 
卡 寿 命 年 等 的 指标 以 及 为 此 而 投入 的 成 本 ， meet dt 
卫生 :经济 分 析 ， 这 样 才 可 能 看 出 一 个 研究 课题 所 产生 的 社会 和 经 济 的 效益 。 

(七 ) 医学 伦理 

临床 科研 务必 要 保障 患者 的 安全 及 权益 , 尊重 患者 的 人 权 和 人 格 为 最 高 伦理 款 准 , 而 课题 
的 立 题 应 通过 伦理 学 组 织 的 审查 批准 方 可 实施 。 对 此 . 任何 临床 试验 都 应 遵照 世界 医学 会 所 制 
定 的 皇 尔 辛 直 宣言 的 精神 。 


















( 刘 晓 清 ” 王 吉 次 ) 
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第 三 章 ”临床 研究 设计 的 基本 要 求 


临床 研究 是 以 病人 及 相应 群体 为 研究 对 象 , 研究 和 论证 某 个 或 某 些 研究 因素 对 疾病 病因 、 
诊断 ,治疗 、 预 后 等 方面 产生 的 效应 或 影响 。 与 理化 实验 及 动物 实验 不 同 , 人 体 作为 最 高 形式 
的 生命 体 , 除 生物 学 属性 存在 个 体 差异 外 , 在 心理 和 社会 功能 属性 方面 也 有 不 同 ; 另外 , 就 疾病 
本 身 而 言 ,病程 病情、 诊治 手段 等 方面 的 差异 , 也 进一步 增加 了 临床 研究 的 复杂 人 性。 因此, 临 
床 研究 的 设计 非常 重要 , 掌握 临床 研究 设计 的 基本 原则 和 基本 要 求 , 将 有 助 于 生产 高 质量 的 临 
床 证 据 。 


第 一 节 ”随机 化 原则 


一 、 概 述 

随机 化 ( randomization ) 是 采用 特殊 手段 ， 使 总 体 或 样本 中 每 个 个 体 发 生 某 事件 的 概率 均 A 
在 临床 研究 中 , 随机 化 主要 应 用 在 抽样 和 分 组 两 个 环节 , 即 在 选取 样本 和 将 研究 对 象 分 组 时 ， 
为 防止 来 自 研究 者 与 被 研究 者 两 个 方面 主观 因素 的 干扰 , 避免 结果 失真 而 采用 随机 化 。 因 此 ， 
随机 化 可 分 为 随机 抽样 与 随机 分 组 两 种 形式 。 

1. 随机 抽样 (random sampling) 由 于 临床 研究 的 目标 总 体 常 常 是 无 限 总 体 ， 如 个 患 某 疾病 
的 所 有 患者 或 发 生 该 疾病 的 潜在 人 群 , 直接 进行 总 体 研究 的 可 行 性 很 小 ; 另 一 方面 , 即使 是 有 
眼 总 体 , 由 于 人 力 、 财 力 、 时 间 等 因素 的 限制 , 也 不 可 能 把 所 有 对 象 都 纳入 研究 , 因此 , 只 能 从 总 














体 中 抽取 一 定 比例 的 样本 、 作 为 总 体 的 代表 进行 研究 。 随 机 抽样 是 在 抽样 过 程 中 ,采用 随机 化 


方法 ,使 总 体 中 所 有 对 象 都 有 同等 的 机 会 被 抽 中 进入 研究 样本 。 随 机 抽样 的 目的 是 保证 样本 的 


| 代表 性 , 避免 发 生 选 择 偏 倚 。 但 在 很 多 临床 研究 中 ,研究 对 象 来 源 于 医院 门诊 及 住院 忠 者 , 数 


量 有 限 , 无 法 进行 随机 抽样 , 而 只 能 连续 纳入 某 段 时 间 内 的 病例 作为 研究 样本 。 
2. 随机 分 组 (random allocating) 随机 分 组 又 叫 随机 分 配 ， 它 是 指 在 研究 样本 确定 后 + 进 一 
步 采用 随机 的 方法 ， 将 研究 对 象 以 同等 的 机 会 分 配 进 入 试验 组 (experimental group ) 或 对 照 组 





| 《eontrol group ) 中 。 通 过 随机 分 组 , 可 以 提高 组 间 的 均衡 性 , 减少 非 研究 因素 的 干扰 。 


二 、 随 机 化 方法 

随机 化 原则 是 针对 每 个 独立 观察 单位 ( sampling unit ) 进 行 随机 抽样 或 随机 分 配 。 因此 ,在 
实施 随机 化 方法 之 前 , 应 根据 研究 目的 及 相应 的 设计 方案 确定 研究 的 基本 单元 , 即 研究 的 独立 
观察 单位 。 临 床 研究 通常 是 以 单个 个 体 (如 某 病 患者 ) 为 独立 观察 单位 。 但 是 , 有 时 因 研 究 目的 
或 研究 因素 的 特殊 性 , 不 能 以 单个 个 体 为 独立 观察 单位 , 而 需要 采用 某 一 特定 组 群 (cluster), 如 
一 对 夫妻 一 个 家 庭 、 一 个 班组 , 甚至 一 个 社区 作为 独立 观察 单位 。 如 探讨 生殖 健康 教育 与 育 
龄 夫妻 避孕 效果 的 关系 , 就 常 以 一 对 夫妻 作为 一 个 独立 观察 单位 。 另 外 一 种 情况 是 以 个 体 的 一 
部 分 器 官 或 组 织 作为 研究 基本 单元 , 如 眼睛 。 

(一 ) 简单 随机 法 (simple randomization) 

简单 随机 法 主要 指 采用 抛 硬 币 、 抽 签 . 掷 仍 子 、 查 随机 数字 表 , 甚至 利用 计算 器 .计算 机 产 
生 的 随机 数字 进行 抽样 或 分 组 的 方法 。 

1. 抛 硬币 、 抽 签 法 ”该 法 主要 用 于 小 样本 研究 。 例 如 和 欲 在 10 个 观察 单位 中 抽取 两 个 作为 
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研究 对 象 , 可 制作 10 个 签 , 其 中 8 个 为 “无 ", 2 个 为 “有 ”, 抽 中 “有 ”者 作为 研究 对 象 。 在 随机 分 
组 时 , 可 事先 规定 硬币 “ 正 ”、“ 反 ” 面 中 的 一 面 为 试验 组 , 另 一 面 则 为 对 照 组 , 然后 将 研究 对 象 依 
次 按照 硬币 抛掷 的 “ 正 *“ 反 ” 面 , 进行 简单 随机 分 组 。 但 要 注意 在 样本 较 小 时 , 硬币 抛掷 出 的 
“ 正 ”、“ 反 ” 面 频率 不 一 定 为 50%, 有 时 可 能 出 现 较 大 偏离 , 使 得 不 同 试验 组 间 观 察 对 象 数 也 存在 
较 大 差异 , 需 进 一 步调 整 。 而 当 遇 到 大 样本 时 , 利用 上 述 方法 进行 抽样 或 分 组 , 操作 较为 繁杂 、 
不 太 方 便 。 

2. 随机 数字 表 法 ”查阅 随机 数字 表 法 是 实现 随机 化 的 一 种 较为 简单 、 实 用 的 方法 。 数 理 
统计 学 家 基于 概率 论 原理 编制 了 随机 数字 表 ( 附 表 ), 表 中 排列 的 数字 无 论 以 行 、 列 或 斜 向 顺序 
都 呈 随 机 状态 。 利 用 随机 数字 表 , 既 可 以 进行 随机 抽样 , 也 可 以 完成 随机 分 组 。 

(1) 随机 抽样 : 例如 , 欲 在 某 医院 门诊 随访 的 250 名 高 血压 患者 中 随机 抽取 20 名 作为 一 种 
降 压 新 药 的 试验 对 象 。 先 将 250 名 高 血压 患者 从 1~250 顺序 编号 , 然后 从 随机 数字 表 任 一 数字 
开始 ,按照 行 / 列 或 斜 向 顺序 产生 20 个 00~99 之 间 的 随机 数 , 每 个 数字 乘 以 250 取 前 3 位 数 , 重 
复 的 数 弃 去 重 抽 , 最 后 , 以 对 应 编号 的 患者 组 成 参加 本 次 试验 的 样本 。 但 应 注意 ,一 旦 确定 行 、 
列 或 斜 向 顺序 后 , 中 途 不 能 任意 更 改 方向 。 





(2) 随机 分 组 : 例如 , 欲 将 符合 试验 要 求 的 20 名 患者 , 随机 分 配 为 试验 组 (A), 对 照 组 (B) | 


2 组。 首先 将 患者 从 1~20 编号 , 然后 从 随机 数字 表 的 任何 一 行 、 任 何 一 列 开始 , 顺序 产生 20 个 
00~99 之 间 的 随机 数 。 按 事先 规定 , 对 应 的 随机 数 为 “奇数 " 者 进入 试验 组 ,为 “偶数 "者 进入 对 
照 组 。 如 从 附 表 “随机 数字 表 ” 第 9 行 , 18 列 开始 , 按 从 左 到 右 , 从 上 到 下 顺序 获取 20 个 随机 数 
字 并 依次 列 入 表 3-1。 





表 3-1 20 例 患者 查 随机 数字 表 分 配 情况 
是 者 编导 江 名 3 A 6 98 9 1 1 2 1 15 16 17 18 ‘9: 20 
随机 表 数 52 77 65 15 33 59 05 28 22 87 26 07 47 86 96 98 29 06 10 58 
归 组 CB TT ord GT TGC TT- GC 














如 果 结 果 显 示 两 组 例 数 不 等 , 则 应 该 进一步 遵循 一 定 的 随机 方法 , 对 两 组 的 例 数 进 行 调整 。 

3. 计算 机 或 计算 器 随机 法 ”该 方法 是 大 样本 研究 中 最 常用 的 一 种 方法 。 大 多 数 具有 编程 
功能 或 数字 计算 功能 的 计算 机 软件 都 可 以 通过 随机 数 发 生 器 产生 的 随机 数 。 计 算 机 产生 的 随机 
数 是 取 值 在 0~1 之 间 ( 不 包括 0 和 1 本 身 ) 均 匀 分 布 的 随机 变量 。 例 如 , 欲 产 生 5 个 0-999 的 随机 
数 , 一 般 需 事先 指定 一 个 种 子 数 (seed), 相当 于 在 随机 数字 表 上 指定 行 和 列 。 可 在 SAS(6.12 版 
本 ) 中 指定 种 子 数 为 8888, 产生 5 个 随机 数 : 0.94732, 0.148 50, 0.63843 , 0.535 16, 0.20371。 因 计 
算 机 产生 的 随机 数 是 在 0~1 之 间 , 要 得 到 0~999 的 随机 数 , 只 需 将 每 个 数 乘 以 1000 并 取 整 , 据 
此 ,以 上 5 个 随机 数 转换 为 :947, 148, 638, 535, 959。 同 一 软件 用 相同 种 子 数 所 产生 的 随机 数 
是 一 样 的 (统计 学 上 称 为 重 现 性 ), 而 不 同 软件 所 得 结果 不 一 样 。 用 函数 计算 器 的 “RAN” 键 ,也 
可 以 产生 取 值 在 0~1 之 间 的 随机 变量 。 每 按 一 次 “RAN” 键 , 可 产生 一 组 随机 数字 

得 到 随机 数字 序列 后 , 可 按照 类 似 随机 数字 表 法 进行 随机 抽样 或 随机 分 组 。 

必须 指出 , 交替 将 受 试 对 象 分 到 试验 组 和 对 照 组 的 分 配方 法 (TCTCTC…… ) 不 属于 简单 随 
机 分 配 法 。 因 为 , 当 研 究 者 预先 知道 下 一 位 患者 将 分 配 到 哪 一 组 时 , 可 能 在 主观 上 对 患者 的 病 
程 早 晚 ,病情 轻重 等 进行 一 定 的 取舍 , 导致 研究 对 象 选择 上 的 偏 倚 。 

(二 ) 分 层 随 机 法 (stratified randomization ) 

1. 分 层 随 机 抽样 (stratified sampling) 该 方法 是 先 将 研究 对 象 按 某 一 特征 进行 分 组 ( 层 
然后 在 各 层 中 采用 简单 随机 的 方法 抽取 研究 对 象 组 成 样本 。 在 进行 分 层 时 , 往往 是 以 a 
变异 影响 较 大 的 因素 作为 分 层 因素 (stratifying fac "tor )。 例 如 , 进行 某 地 区 糖尿 病 患 病 率 调 查 时 ， 
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可 以 以 城乡 .年 龄 、 性 别 等 对 糖尿 病 患 病 影响 较 大 的 因素 作为 分 层 因素 。 分 层 随机 抽样 可 以 保 
证 各 “ 层 " 都 有 一 定 研究 对 象 进 入 样本 , 提高 了 样本 的 代表 性 。 
| 2. 分 层 随 机 分 组 (stratified allocating ) 分 组 时 , 也 是 按照 研究 对 象 按 某 一 特征 先进 行 分 组 
( 层 ), 然后 再 在 各 层 中 按 简单 随机 的 方法 , 分 配 试 验 对 象 与 对 照 组 对 象 , 最 后 将 各 层 试验 对 象 合 
在 一 起 作为 试验 组 、 将 各 层 对 照 对 象 合 在 一 起 作为 对 照 组 。 在 分 层 随机 分 组 中 , 主要 以 研究 对 
象 中 某 些 可 能 产生 混杂 作用 的 特征 作为 分 层 因素 , 如 研究 对 象 的 重要 临床 特征 或 预后 因素 ( 包 
括 年 龄 ,性别 、 病 情 、 有 无 合并 症 等 )。 在 临床 研究 中 , 可 基于 以 下 原则 没 管 分 层 因 素 : 选择 所 
研究 疾病 或 其 并 发 症 的 危险 因素 ; @ 选 择 对 所 研究 疾病 预后 有 明显 影响 的 因素 ; @ 遵 循 最 小 化 
原则 , 将 分 层 因素 控制 到 最 低 限度 , 否则 分 层 过 多 , 会 造成 组 内 研究 对 象 过 度 分 散 。 
| 例如 , 慢性 心房 纤 闸 复 律 后 进行 抗 心 律 失常 药物 维持 治疗 的 随机 对 照 研究 。 考 虑 到 慢性 
心房 纤 闸 患者 的 预后 与 病因 、 心 脏 大 小 及 心房 纤 闸 病 程 长 短 有 密切 关系 , 因此 , 宜 针对 上 述 三 
个 因素 (病因 : 瓣膜 性 心脏 病 与 非 辩 膜 性 心脏 病 ; @ 心 脏 大 小 : 心胸 比例 >0.50 和 <0.50; @@ 病 
程 : 心房 纤 额 病程 >6 个 月 及 <6 个 月 ) 进 行 分 层 随 机 分 组 (图 3-1)。 
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| 3-1 ”分 层 随机 分 组 
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经 图 3-1 所 示 的 分 层 随 机 分 配 过 程 , 可 以 使 病因 、 心 脏 大 小 、 病 程 这 三 个 对 治疗 效果 和 预后 
| 有 较 大 影响 的 因素 在 试验 组 (T) 与 对 照 组 (C) 间 保持 平衡 。 

分 层 随机 分 组 可 以 保证 各 “ 层 "都 有 对 象 进入 试验 组 或 对 照 组 , 提高 了 试验 组 间 的 均衡 性 。 
但 在 大 样本 临床 试验 中 , 当 样 本 量 达 数 百 甚至 上 千 时 , 可 不 考虑 分 层 随 机 分 组 。 一 方面 , 大 样 
本 经 过 简单 随机 分 配 后 , 不 同 试验 组 间 的 基线 状况 往往 具有 可 比 性 ; 男 一 方面 ,需要 有 完整 的 
多 研究 对 象 名 单 后 才能 进行 分 层 随机 分 组 , 但 对 大 样本 而 言 , 可 操作 性 不 大 。 如 果 在 资料 分 析 时 
守 记 也。 | 发 现 试验 组 之 间 均 衡 性 不 好 , 还 可 以 通过 分 层 分 析 进 行 统计 学 处 理 。 注 意 , 分 层 随机 分 组 与 分 
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层 分 析 是 两 个 不 同 的 概念 和 方法 。 分 层 随 宙 分 组 是 在 设计 阶段 , 对 一 些 可 能 对 研究 结果 产生 较 
大 影响 的 非 研究 因素 而 采取 的 一 种 控制 措施 , 其 目的 是 增强 组 间 的 可 比 性 。 而 分 层 分 析 则 是 在 
试验 结束 后 , 针对 某 些 可 能 对 研究 结果 产生 影响 的 因素 而 采用 的 一 种 统计 分 析 方 法 。 当 样本 量 
较 小 、 分 层 后 有 些 层 组 可 能 出 现 对 象 数 为 “ 零 " 的 情况 时 , 应 慎 用 分 层 分 析 。 

(三 ) 区 组 随机 法 (block randomization) 

区 组 随机 法 主要 用 于 随机 分 组 。 区 组 随机 分 组 是 先 将 研究 对 象 分 为 不 同 区 组 , 然后 再 对 每 
一 区 组 内 的 个 体 进 行 随机 分 配 。 在 临床 研究 中 , 每 一 区 组 的 研究 对 象 数 一 般 按 组 别 的 固定 倍数 
来 确定 。 如 研究 分 为 试验 组 、 对照 组 两 组 , 则 区 组 例 数 可 选 2、4、6、8 等 ,但 区 组 例 数 越 大 , 研 
究 对 象 在 分 配 时 的 排列 组 合 越 复 杂 。 例 如 某 研 究 分 为 试验 组 (T)、 对照 组 (C)2 组 ,确定 区 组 例 
数 为 4。 首先 , 研究 对 象 按 进入 试验 的 先后 顺序 ,每 4 个 人 一 组 , 然后 再 对 每 一 区 组 的 4 个 研究 
对 象 分 别 根据 随机 数字 表 进 行 随机 分 组 。 区 组 随机 分 组 的 特点 之 一 就 是 分 组 后 各 组 人 数 相 等 。 
但 当 样本 量 偏 小 时 , 也 可 能 出 现 2 组 例 数 不 等 的 情况 , 必须 进行 适当 调整 。 

区 组 随机 分 组 有 两 方面 优点 : 保证 各 组 人 数 相等 ; @ 便 于 逐渐 累积 临床 病例 。 如 上 例 ， 
每 积累 4 例 研 究 对 象 即 可 进行 分 组 并 开始 试验 , 不 需要 把 所 有 样本 全 部 收集 齐 后 再 进行 分 组 
研究 。 

(四 ) 系统 随机 抽样 法 (systematic sampling ) 

系统 随机 抽样 简称 系统 抽样 或 机 械 抽样 (mechanical sampling)。 即 先 将 总 体 的 观察 单位 按 

一 特征 的 顺序 (如 按 入 院 先 后 顺序 ) 编 号 ,再 根据 抽样 比例 将 其 分 为 若干 部 分 , 先 从 第 一 部 分 
随机 抽取 第 一 个 观察 单位 , 然后 按 一 固定 间隔 在 第 二 、 第 三 …… 等 各 部 分 抽取 观察 单位 组 成 样 
本 。 例如, 欲 从 2000 个 观察 单位 中 抽取 100 个 组 成 样本 . 即 抽样 比例 为 5%( 抽样 间隔 为 20 )， 
可 先 从 第 1~20( 第 一 部 分 ) 之 间 随 机 抽出 一 个 观察 单位 , 如 为 12 号 , 此 后 按 每 隔 20 抽取 一 个 单 
位 , 即 32、52、72…… 至 1992 号 组 成 样本 。 

系统 抽样 的 优点 是 简单 易 行 , 适用 于 大 样本 的 流行 病 学 调查 , 样本 的 观察 单位 在 总 体 中 分 
布 均匀 , 抽样 代表 性 较 好 。 缺 点 是 如 果 总 体 各 单元 的 排列 顺序 存在 一 定 周期 性 , 以 这 种 方法 进 
行 抽样 则 可 能 出 现 较 大 的 偏 全。 例如, 某 工 厂 工作 证 编号 中 末 位 数 代 表 车 间 , 用 该 法 按 工 作证 
顺序 抽样 则 可 能 抽 到 的 全 部 是 同一 车 间 的 对 象 , 使 样本 不 能 代表 全 厂 的 情况 。 

(五 ) 整 群 随机 法 (cluster randomization) 

整 群 随 机 法 是 以 现成 的 群体 (社区 、 街 道 、 乡 、 村 、 医 院 、 病 房 等 ) 而 不 是 个 体 为 单位 , 进行 
抽样 或 分 组 。 在 整 群 随机 抽样 (简称 整 群 抽样 ) 中 , 抽 到 的 群体 中 的 所 有 观察 单位 , 都 将 作为 研 
究 样 本 。 例 如 ,采用 整 群 抽样 方法 , 从 某 地 区 的 20 所 小 学 中 随机 抽取 2 个 学 校 , 并 对 这 2 个 小 
学 的 全 部 学 生 进行 视力 检查 , 以 了 解 该 地 区 小 学 生 近 视 率 。 同 样 , 在 整 群 随机 分 组 中 , 被 分 到 
试验 组 的 群体 中 的 每 个 观察 单位 , 都 作为 试验 对 象 , 被 分 到 对 照 组 的 群体 中 的 每 个 观察 单位 ， 
都 作为 对 照 对 象 。 

采用 整 群 随机 法 要 求 群 间 的 变异 越 小 越 好 , 否则 将 影响 样本 的 代表 性 或 组 间 的 可 比 性 。 一 
般 情况 下 , 用 相同 的 样本 含量 , 整 群 抽样 的 抽样 误差 最 大 , 整 群 随机 分 组 的 组 间 可 比 性 最 小 。 
但 是 , 整 群 随机 法 具有 节约 人 力 、 物 力 、 方 便 、 容 易 实施 等 优点 ,在 实际 工作 中 可 行 性 较 好 ,适用 
于 大 规模 研究 。 

(六 ) 多 级 抽样 法 (multi-stage sampling) 

多 级 抽样 是 一 种 从 大 到 小 多 个 级 别 进行 的 抽样 方法 。 首 先 从 总 体 中 随机 抽取 范围 较 大 的 
单元 , 称 为 一 级 抽样 单元 (例如 省 .市 ), 再 从 抽 中 的 一 级 单元 随机 抽取 范围 较 小 的 二 级 单元 ( 如 
区 街道 ), 若 抽样 到 此 为 止 称 为 二 级 抽样 , 若 再 继续 往 小 范围 抽样 , 则 称 为 多 级 抽样 。 

在 一 些 大 规模 研究 (全 国 高 血压 抽样 调查 全国 糖尿 病 患 病 率 调查 等 ) 项 目 中 , 多 级 抽样 成 
为 唯一 实用 的 抽样 方法 。 在 具体 实施 的 时 候 , 多 级 抽样 常常 与 上 述 各 种 基本 抽样 方法 综合 使 用 。 
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(七 ) 半 随 机 化 法 (quasi-randomization) 

不 按 随机 数字 产生 序列 号 , 而 是 根据 被 纳入 研究 对 象 的 出 生日 期 、 住 院 号 或 门诊 号 等 分 为 
单 、 双 数 , 分 别 将 单数 者 分 为 1 组 , 双 数 者 分 为 另 一 组 , 这 种 方法 称 半 随机 化 方法 。 

当 进 行 大 样本 研究 时 , 如 社区 人 群 的 试验 , 利用 半 随 机 化 分 配 受 试 者 既 简便 、 实 用 , 同时 也 
能 较 好 地 实现 组 间 均 衡 。 但 在 临床 试验 中 ,研究 对 象 往往 较 少 , 半 随 机 化 很 难 达 到 组 间 均 衡 ， 
因而 该 方法 的 使 用 受到 限制 。 


三 、 随 机 化 分 配 的 优 缺点 


(一 ) 优点 

1. 随机 分 配 保证 了 研究 组 之 间 的 均衡 、 可 比 。 特 别 是 采用 分 层 随 机 分 配 , 可 使 一 些 影响 疾 
病 进程 的 重要 临床 特征 , 以 及 一 些 已 知 可 对 研究 结果 产生 影响 的 混杂 因素 在 研究 组 间 保持 均 
衡 , 有 效 避 免 了 这 些 因素 对 研究 结果 的 干扰 。 

2. 随机 分 配 可 以 防止 选择 偏 傈 和 来 自 研究 者 、 被 研究 者 两 方面 主观 因素 的 干扰 , 确保 了 研 
究 结果 的 真实 可 靠 。 

3. 随机 分 配 结合 言 法 一 起 使 用 , 可 以 使 研究 结果 更 加 客观 , 大 大 提高 研究 结果 的 准确 性 。 

(二 ) 缺点 

1. 在 随机 分 配 过 程 中 , 为 了 保证 组 间 的 均衡 、 可 比 , 往往 使 研究 对 象 局 限于 符合 条 件 的 串 
者 , 因而 可 能 导致 研究 对 象 代表 性 的 降低 , 使 研究 结果 的 推广 范围 受到 局 限 。 

2. 随机 化 分 配 往往 需要 累积 一 定数 量 的 研究 对 象 后 才能 实施 , 增加 了 临床 研究 的 难度 。 

3. 随机 分 配 可 能 违背 研究 对 象 的 个 人 意愿 , 存在 医德 问题 。 


四 、 随 机 化 过 程 中 需 注意 的 问题 


在 使 用 随机 化 方法 时 , 应 注意 以 下 问题 : 

1. 随机 化 分 组 时 , 必须 对 随机 化 方案 进行 保密 , 该 过 程 称 为 随机 化 分 配 的 隐匿 (concealment )* 
从 某 种 意义 上 讲 , 随 机 化 分 配 的 隐匿 比 单纯 产生 随机 分 配 序列 本 身 更 加 重要 。 如 果 随 机 分 本 
序列 产生 者 与 试验 执行 者 (分 配 受 试 对 象 人 组 者 ) 为 同一 人 , 试验 执行 者 就 可 以 预知 下 一 位 受 
试 对 象 将 被 分 入 哪 一 组 。 在 这 种 情况 下 , 很 难 避 免 因 研 究 人 员 主 观 因素 造成 的 对 受 试 对 象 的 
刻意 选择 ,甚至 改变 分 配方 案 , 所 带 来 的 偏 倚 。 因 此 , 随机 化 分 配方 案 的 隐匿 就 是 让 分 配 受 斌 
对 象 人 组 的 试验 执行 者 事先 不 知道 随机 分 配方 案 的 具体 内 容 , 无 法 预知 下 一 位 人 选 的 对 象 将 
进入 哪 一 组 。 实 现 随机 化 分 配 隐匿 的 方法 有 中 心 电 话 随机 系统 、 药 房 控制 随机 分 配方 案 、 利 
用 编号 或 编码 的 药品 容器 、 按 顺序 编码 .密封 人 不 透 光 的 信封 等 ， 研究 者 可 根据 具体 情况 选择 
应 用 。 
2. 为 了 保证 实验 的 可 靠 性 , 研究 中 所 用 随机 化 方法 、 随 机 数 等 均 应 详细 记录 。 如 果 是 用 计 
算 机 产生 的 随机 数 , 需要 报告 产生 随机 数 的 程序 、 种 子 数 等 ; 如 果 是 从 随机 数字 表 获 得 随机 数 ， 
必须 说 明 所 用 随机 数字 表 .起 始 页 .起 始 行 .起 始 列 及 获取 方法 。 特 别 是 在 新 药 的 临床 试验 中 ， 
随机 数 必须 具有 重 现 性 , 产生 随机 数 的 参数 及 程序 应 与 盲 底 一 起 封存 。 
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一 .概述 
所 谓 “对 照 (control)”, 指 的 是 在 临床 研究 过 程 中 , 设立 条 件 类 似 、 诊 断 一 致 的 可 供 相互 比较 


的 组 别 。 
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“有 比较 才 有 鉴别 ”, 这 是 辩证 唯物 主义 认识 事物 的 基本 法 则 。 临 床 研究 主要 是 探讨 某 个 或 
某 些 研究 因素 对 疾病 病因 、 诊 断 、 治 疗 、 预 后 等 方面 产生 的 效应 大 小 及 其 安全 性 , 但 由 于 临床 事 
件 的 发 生 有 着 很 大 的 不 确定 性 , 因此 , 需要 通过 对 照 比 较 才 能 得 出 可 靠 结论 。 

二 、 设 置 对 照 的 意义 

在 临床 研究 中 ,除了 干预 措施 (处 理 因素 ) 的 效应 外 , 还 有 很 多 因素 可 能 左右 临床 结局 : 

1. 不 能 预知 的 结局 (unpredictable outcome ) 由 于 个 体 的 生物 学 变异 和 社会 .心理 因素 的 影 
响 , 导致 临床 上 患 相同 疾病 的 个 体 , 其 临床 特征 (临床 表现 、 病 情 轻重 、 预 后 等 ) 存 在 较 大 差异 。 
例如 感冒 细菌 性 痢疾 、 病 毒性 肝炎 等 许多 传染 性 疾病 都 有 明显 的 自 愈 倾向 , 而 在 高 血压 、 糖 尿 
病 、 胃 溃疡 等 慢性 病 的 病程 中 , 也 存在 病情 的 自行 缓解 或 加 重 现象 , 即使 是 恶性 肿瘤 , 其 生存 时 
间 长 短 、 并 发 症 的 发 生 等 情况 也 各 不 相同 。 

2. 霍 桑 效应 (Hawthome effect) 指 人 们 因 成 为 研究 中 特别 感 兴趣 和 受 关注 的 对 象 而 产生 的 
一 种 正 向 心理 一 一 生理 效应 , 这 种 效应 与 他 们 接受 的 干预 措施 的 特异 性 作用 无 关 。 霍 桑 效 应 一 
般 是 一 种 正 向 效应 , 即 与 干预 措施 预期 效果 同 向 的 效应 。 但 有 时 也 可 能 因为 厌恶 某 医生 或 不 信 
任 某 医疗 单位 而 产生 负 向 效应 。 

3. 安慰 剂 效应 (placebo effect) 某 些 研究 对 象 , 即使 仅 使 用 了 安奈 剂 . 也 可 能 表现 出 病情 好 
转 等 不 该 有 的 效果 , 其 实质 是 某 些 研究 对 象 由 于 医药 依赖 而 产生 的 一 种 正 向 心理 效应 。 

4. 向 均 数 回归 现象 (regression to the mean) 指 一 些 极端 的 临床 症状 和 体征 有 向 均 数 接近 的 
倾向 。 如 血压 水 平 处 于 高 限 5% 的 人 , 即使 不 给 任何 处 理 , 经 过 一 段 时 间 后 , 其 血压 值 也 可 能 有 
所 降低 (向 均 数 靠近 )。 

5. 潜在 未 知 因素 的 影响 ”由 于 知识 水 平和 认识 的 局 限 性 , 很 可 能 还 存在 一 些 影响 干预 效 
应 的 因素 ,但 目前 尚未 被 人 们 所 认识 。 

因此 , 在 临床 研究 中 设立 合理 的 对 照 非常 必要 , 其 主要 目的 是 消除 非 处 理 因素 的 干扰 , 鉴 
别 试验 性 与 非 试 验 性 效应 , 减少 或 消除 试验 误差 。 

三 、 对 照 的 种 类 

(一 ) 按照 研究 的 设计 方案 分 类 

1. 同期 随机 对 照 (concurrent randomized control) 按 严格 规定 的 随机 化 方法 将 研究 对 象 同 
期 分 配 到 试验 组 和 对 照 组 , 以 此 方案 设置 的 对 照 类 型 称 为 同期 随机 对 照 。 

同期 随机 对 照 的 优点 主要 有 三 方面 : 随机 化 分 组 , 可 以 较 好 地 保证 试验 各 组 之 间 的 均 
衡 可 比 , 有 效 吕 免 了 潜在 未 知 因素 对 试验 结果 的 影响 ; @ 设 置 同期 对 照 , 可 以 同时 对 各 试验 组 
进行 观察 , 有 效 避 免 了 因 试 验 先后 顺序 对 结果 的 影响 , 使 研究 结果 更 有 说 服 力 ; @ 由 于 多 数 统 
计 方 法 都 是 建立 在 随机 样本 的 基础 之 上 ,采用 本 设计 类 型 更 有 利于 资料 的 统计 分 析 , 不 需要 对 
数据 进行 校正 。 同 期 随机 对 照 的 缺点 是 : 需要 有 一 半 对 象 充当 对 照 , 因此 所 需 样 本 量 较 大 ; 
@ 必 须 收 集 到 样本 含量 所 需 的 全 部 对 象 后 才能 进行 试验 , 增加 了 研究 的 难度 ; @ 在 有 些 情况 下 
可 能 涉及 医德 问题 
































j 题 。 

2. 自身 对 照 (self control) 将 一 组 受 试 对 象 分 为 前 后 两 个 阶段 , 分 别 施加 不 同 的 干预 措施 ， 
然后 比较 两 个 阶段 的 两 种 处 理 效应 的 差异 。 一 般 在 前 一 阶段 结束 后 应 有 一 段 时 间 间 隔 , 称 为 洗 
脱 期 。 设 置 洗 脱 期 的 目的 是 为 了 避免 前 一 阶段 的 处 理 效应 对 后 一 阶段 产生 影响 。 

自身 对 照 主 要 适用 于 慢性 反复 发 作 性 疾病 的 治疗 性 研究 , 这 一 类 疾病 病程 长 ,病情 变化 不 
大 , 允许 进行 分 阶段 处 理 与 观察 。 采 用 自身 对 照 可 以 消除 个 体 差异 , 减少 一 半 样 本 量 , 并 且 保 
证 每 个 受 试 对 象 都 接受 有 效 治疗 的 处 理 ; 缺点 是 难以 保证 两 个 阶段 的 病情 完全 一 致 , 可 能 存在 
处 理 先 后 对 结果 的 影响 。 
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3. 交叉 对 照 (cross-over design control) 将 两 组 受 试 对 象 分 两 个 阶段 进行 试验 。 第 一 阶段 
”一 组 试验 用 A 措施 , 间隔 一 段 洗 脱 期 后 再 试验 B 措施 ; 另 一 组 第 一 阶段 试验 B 措施 , 间隔 一 段 
洗 脱 期 后 再 试验 A 措施 , 然后 对 比 A、B 两 种 措施 的 效果 。 

交叉 对 照 同 样 可 以 保证 每 个 受 试 对 象 都 接受 有 效 治疗 的 处 理 , 消除 个 体 差异 , 节约 样本 量 ， 
提高 统计 效率 , 同时 可 以 避免 因 试验 先后 顺序 对 结果 的 影响 ; 但 是 , 该 方法 的 应 用 也 主要 限于 


| 慢性 复发 性 疾病 。 





| 4. 配对 对 照 (matching control ) 将 可 能 对 研究 结果 产生 影响 的 混杂 因素 (如 年 龄 性别. 病 
| 情 等 ) 作 为 配 比 条 件 , 为 每 一 个 试验 对 象 选 配 一 个 以 上 的 对 照 ,通常 采用 1:1 或 1:2 配 对 。 
| 配对 对 照 可 以 最 大 限度 地 保证 组 间 均 衡 性 , 避免 已 知 混杂 因素 对 结果 的 干扰 。 
5. 非 随 机 同期 对 照 (non-randomized concurrent control) 有 同期 对 照 ， 但 试验 组 与 对 照 组 未 
| 严格 按 随机 化 原则 进行 分 组 。 例 如 在 多 中 心 临床 试验 中 , 将 一 个 医院 的 对 象 全 部 作为 试验 组 ， 
而 另 一 个 医院 的 对 象 全 部 作为 对 照 组 进行 研究 。 

非 随机 同期 对 照 的 设置 简便 易 行 , 易 为 医生 和 患者 接受 ; 缺点 是 由 于 非 随机 分 配 , 可 能 因 
选择 偏 倚 导 致 两 组 基线 情况 不 一 致 ,可比 性 较 差 

6. 历史 对 照 (historical control) 试验 仅 设 一 组 接受 新 干预 措施 , 并 与 过 去 采用 的 旧 干预 措 
施 进 行 比较 。 因 此 , 历史 对 照 属于 非 随机 、 非 同期 对 照 。 
历史 性 对 照 的 资料 可 以 通过 查阅 医学 文献 和 医院 病历 记录 获得 。 优 点 是 节省 时 间 经费， 
| 不 存在 医德 问题 ; 但 通常 既往 的 资料 中 的 研究 对 象 、 条 件 、 环 境 等 都 很 难 与 本 次 试验 保持 一 致 . 
可 比 性 差 , 一般 不 宜 采用 。 在 特殊 情况 下 , 如 对 一 些 预 后 极 差 的 疾病 , 采用 历史 对 照 还 是 有 一 
定 说 服 力 的 。 如 恶性 滋养 层 细胞 瘤 在 20 世纪 50 年 代 单 用 手术 治疗 , 预后 极 差 。 随 着 化 疗 和 放 
| 疗 的 进展 ,联合 化 疗 的 有 效率 达 70%~90%, 对 这 两 个 历史 阶段 中 , 同一 疾病 的 不 同治 疗效 果 进 
行 历史 对 照 , 证 明 现 在 的 治疗 效果 明显 提高 , 预后 显著 改善 , 为 人 们 所 公认 。 

(二 ) 按照 对 照 组 的 处 理 措施 分 类 

在 以 上 各 种 对 照 设置 方案 中 , 试验 组 的 处 理 一 般 是 施加 某 种 需要 评价 的 干预 措施 (处 理 因 
素 ), 而 对 照 组 也 需要 采用 相应 的 对 照 措施 ( 对照 因素 )。 目 前 使 用 较 多 的 对 照 措施 有 有 效 对 照 
| “(阳性 对 照 )、 空 白 对 照 .安慰 剂 对 照 等 。 

1. 有 效 对 照 ” 即 以 目前 临床 公认 的 有 效 处 理 方法 (如 治疗 某 病 常规 有效 的 治疗 方法 ) 施 
加 给 对 照 , 然后 与 试验 组 处 理 措施 (新 治疗 方法 ) 的 效果 相 比 较 。 这 类 试验 通常 采用 随机 双 盲 设 




















治疗 , 较 少 引起 伦理 学 及 医德 方面 的 问题 。 

2. 空白 对 照 (blank control) 对 照 组 在 试验 期 间 不 给 任何 处 理 ， 仅 对 他 们 进行 观察 、 记 录 结 
果 , 并 将 其 与 试验 组 的 效应 进行 比较 。 

在 空白 对 照 中 , 对 照 组 成 员 在 试验 阶段 未 得 到 任何 治疗 , 可 能 造成 不 良 后 果 , 应 用 时 要 特 
别 遵 慎 。 空白 对 照 不 能 用 于 急 、 重 或 有 较 重 器 质 性 病变 的 病人 , 仅 用 于 病情 轻 、 稳 定 , 即使 不 给 
任何 治疗 也 不 会 导致 病情 恶化 的 疾病 (如 近视 ), 否则 将 产生 伦理 和 医德 方面 的 问题 。 

3. 安 剑 剂 对 照 (placebo control) 安慰 剂 是 不 具有 真正 治疗 或 致 病 效应 的 制剂 。 将 安慰 剂 
与 试验 措施 进行 比较 称 为 安慰 剂 对 照 。 常 用 的 安奈 剂 为 没有 药理 活性 , 但 其 色 、 形 、 味 均 与 试验 
的 新 药 完全 相同 的 制剂, 如 淀粉 ,乳糖 .维生素 等 。 若 注射 给 药 , 多 采用 生理 盐水 作为 安慰 剂 。 





奈 剂 效应 。 采 用 安慰 剂 对 照 的 主要 目的 是 为 消除 主观 因素 的 影响 , 便于 盲 法 的 实施 。 安 怀 剂 对 
| 照 与 空白 对 照 一 样 ,主要 用 于 病情 轻 、 稳 定 , 或 目前 没有 有 效 治疗 方法 的 疾病 。 同 时 , 也 应 注意 
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一 .要 述 

育 法 试验 (blind trial ) 是 指 临床 研究 过 程 中 , 指标 的 观测 、 数 据 的 收集 和 结论 的 形成 等 均 在 
不 知晓 研究 对 象 所 在 的 组 别 以 及 不 知晓 所 接受 的 是 何 种 措施 的 前 提 下 进行 。 此 外 , 盲 法 还 可 用 
于 统计 分 析 之 中 。 

临床 研究 要 求 对 每 一 个 研究 对 象 的 诊断 、 疗 效 或 预后 等 作出 准确 、 可 靠 的 测量 与 评价 , 否 
则 将 出 现 测 量 偏 倚 (measurement bias ), 导致 研究 结果 失真 。 在 临床 试验 中 ,测量 偏 倚 既 可 来 自 
人 研究 人 员 方 面 , 也 可 产生 于 研究 对 象 方面 。 一 旦 研究 对 象 知晓 自己 的 分 组 情况 , 可 预知 疗效 或 
预后 ,产生 霍 桑 效 应 , 甚至 会 对 治疗 丧失 信心 而 中 途 退 出 。 另 一 方面 , 若 研 究 人 员 知 晓 受 试 对 
象 的 分 组 情况 , 则 可 能 因 希 望 研究 得 出 阳性 结论 而 有 意 或 无 意识 地 上 暗示 受 试 对 象 , 诱导 治疗 组 
对 象 多 报告 有 利 结果 , 对 照 组 对 象 多 报告 不 利 结果 。 进 行 盲 法 试验 的 目的 就 是 为 了 克服 可 能 来 
自 研究 者 或 受 试 者 的 主观 因素 所 导致 的 偏 倚 。 

二 、 盲 法 的 分 类 

育 法 试验 的 基本 原则 就 是 让 受 试 对 象 和 (或 ) 研 究 人 员 无 法 知晓 哪些 人 接受 的 是 处 理 措施 ， 
哪些 人 接受 的 是 对 照 措 施 。 在 一 项 临床 研究 中 , 往往 涉及 研究 对 象 、 干 预 措施 执行 者 、 结 果 测 
量 者 、 统 计 分 析 者 和 论文 撰写 者 等 ,根据 “ 盲 ”的 对 象 不 同 , 一般 可 将 盲 法 分 为 单 盲 、 双 盲 、 三 盲 
等 3 种 类 型 。 

(一 ) 单 言 

1. 定义 ”对 于 研究 对 象 的 分 组 及 所 施加 的 处 理 因素 (如 选用 药物 ) 情 况 , 只 有 研究 者 知道 ， 
而 受 试 对 象 不 知晓 , 叫做 单 盲 (single-blind )。 所 以 ,“ 单 盲 ” 主要 是 盲 研究 对 象 。 另 外 , 对 检验 人 
员 病理 学 检查 人 员 等 隐瞒 患 者 的 诊断 与 治疗 情况 , 便于 他 们 客观 报告 试验 结果 , 也 属于 单 盲 。 

2. 优点 

(1) 方 法 简便 易 行 。 

(2) 干预 措施 执行 者 和 结果 测量 者 知道 受 试 对 象 的 分 组 情况 , 便于 更 好 地 观察 、 掌 握 病 情 。 
一 旦 病情 发 生变 化 , 可 以 及 时 、 恰 当 调整 处 理 方案 或 采取 其 他 干预 措施 , 使 受 试 对 象 免 受伤 害 。 

(3 ) 减少 了 因 受 试 对 象 主观 因素 对 研究 结果 的 影响 。 

3. 缺点 ， 单 盲 不 能 消除 研究 方 主观 因素 造成 的 影响 。 主 管 医生 可 能 通过 不 同 途径 去 影响 
患者 的 疗效 , 比如 , 医生 对 接受 新 疗法 的 患者 观察 特别 仔细 , 护士 对 新 疗法 组 患者 更 加 关心 和 
热情 , 这 些 都 可 能 影响 或 暗示 受 试 对 象 产生 不 同 的 反应 。 

(二 ) 双 讶 

1. 定义 ” 受 试 对 象 和 试验 执行 者 (干预 措施 执行 者 及 结果 测量 者 ) 双 方 均 不 知晓 分 组 情 
况 , 也 不 知道 受 试 者 接受 的 是 何 种 干预 措施 , 称 为 双 盲 (double-blind )。 

2. 实施 方法 及 注意 事项 

(1) 双 育 试 验 往往 与 安慰 剂 和 随机 化 分 配 的 隐匿 同时 配合 实施 。 随 机 化 分 配 的 隐匿 是 双 
育 试 验 的 基础 , 没有 随机 化 隐匿 过 程 , 则 无 法 保证 受 试 对 象 与 试验 执行 者 双 盲 , 而 设计 科学 、 合 
理 .逼真 的 安奈 剂 则 是 实现 双 盲 所 必 备 的 条 件 。 

(2) 双 盲 试验 要 有 严格 的 管理 制度 和 方法 , 组织 严密 .操作 规范 。 在 双 育 试验 过 程 中 ,需要 
有 “局 外 ”的 管理 、 监 督 者 ,他们 不 直接 参加 临床 研究 的 观测 和 数据 收集 , 仅 参 与 研究 设计 、 药 物 
编码 的 控制 与 保密 、 资 料 的 保管 、 分 析 等 , 而 受 试 对 象 和 研究 的 执行 者 只 知道 每 个 试验 对 象 的 
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药物 编号 , 如 A 和 B。 待 试验 结束 并 完成 数据 分 析 后 , 才 由 密码 控制 者 当 着 主要 研究 人 员 的 面 ， 
公布 隐匿 的 随机 化 方案 并 宣布 A 药 和 B 药 究竟 是 试验 制剂 还 是 对 照 制剂 。 该 过 程 称 为 “ 揭 盲 ”。 
(3) 双 言 试验 要 求 各 组 的 药物 在 外 观 的 形状 、 大小、 颜色, 给 药 的 途径 、 方 法 、 次 数 上 保持 一 
致 , 若 有 政 漏 , 则 可 能 导致 泄密 , 失去 “ 言 法 ”的 作用 。 药 物 临 床 试验 时 , 若 试验 药 与 丈 
型 不 一 样 ,可 采取 “ 双 盲 双 摸 拟 ”方法 : 试验 药 + 与 对 照 药 剂型 一 样 的 安慰 剂 ; 对 照 药 + 与 试 难 
药剂 型 一 样 的 安慰 剂 , 并 分 别 编 上 密码 。 若 制剂 的 效应 维持 时 间 不 同 , 也 可 以 采用 “ 双 
拟 " 方 案 进行 。 例 如 , 用 双 盲 法 评价 两 种 抗 高 血压 药 的 效果 。 一 组 用 组 释 的 抗 高 血压 药 , 每 日 一 
次 ; 另 一 组 用 B 受 体 阻 滞 剂 , 每 日 两 次 。 在 执行 时 可 采用 两 组 患者 每 天 早 、 晚 各 给 药 一 次 。 药 名 
标 出 A 和 了 B, 两 组 患者 均 为 早上 服 A 药 一 片 , 晚上 服 B 药 一 片 , 而 两 组 患者 所 用 A 药 和 B 药 是 
不 同 的 。 具 体 做 法 如 下 : 每 日 服药 一 次 组 : A 药 = 慢 释放 的 抗 高 血压 药 ;B 药 = 安奈 剂 。 每 日 服 
药 两 次 组 : A 药 =B 受 体 阻 滞 剂 ; B 药 =B 受 体 阻 滞 剂 。 
(4) 在 育 法 试验 过 程 中 ,一旦 某 一 受 试 对 象 的 病情 突然 发 生变 化 , 如 出 现 严重 的 副作用 、 治 
疗 无 效 或 病情 加 重 等 , 必须 立即 停止 试验 ,予以 “ 破 盲 ”, 并 同时 使 用 必要 的 治疗 措施 。 因 此 , 在 
盲 法 试验 进行 之 前 , 需 事先 制定 出 明确 的 停 药 或 更 换 指 征 , 以 免 给 受 试 者 带 来 不 良 后 果 。 同 时 ， 
盲 ”应 局 限 在 较 小 范围 内 进行 , 以 尽量 减少 因 “ 破 盲 ” 带 来 的 影响 。 
3. 优 缺 点 
(1) 优点 : 是 临床 试验 最 常用 的 一 种 讶 法 形式 , 可 以 有 效 避 免 受 试 对 象 和 试验 执行 者 主观 因 
素 对 试验 结果 的 影响 。 尤 其 对 干预 措施 的 评价 指标 是 以 主观 指标 (如 恶心 、 哎 吐 、 头 痛 、 乃 举 、 
呼吸 困难 等 ) 为 主 时 , 采用 双 讶 试验 能 够 有 效 减 少 测量 偏 倚 的 发 生 。 
(2) 缺点 : 在 管理 上 缺乏 灵活 性 ; @ 有 特殊 副作用 的 药物 容易 被 破 盲 ; @ 双 盲 试验 不 适用 
于 危重 患者 。 
(三 ) 三 言 
1. 定义 三 言 (uiple blind) 是 指 , 受 试 对 象 、 试 验 执行 者 和 资料 分 析 与 报告 者 三 方 均 不 知 
晓 受 试 者 接受 的 是 何 种 干预 措施 , 全 部 采用 编号 密封 , 它 可 避免 双 盲 法 在 资料 分 析 阶 段 的 测量 
偏 倚 。 
2. 优 缺 点 
(1) 可 以 使 偏 倚 减 到 最 小 的 程度 , 使 评价 结果 更 趋 真实 。 
(2) 设 计 复杂 , 执行 难度 较 大 , 常 因 医德 沾染 、 补 偿 、 失 密 等 问题 而 难以 坚持 。 
(3) 当 受 试 对 象 的 病情 突然 发 生变 化 时 , 难以 及 时 掌握 治疗 情况 , 造成 处 理 延误 。 
所 以 ,尽管 三 盲 试验 是 减少 偏 倚 最 有 效 的 方法 ,但 在 实际 工作 中 使 用 并 不 普遍 。 在 许多 临 
床 研究 中 , 由 于 临床 医师 既是 试验 设计 者 与 观察 者 , 也 是 资料 分 析 和 结果 评价 者 , 很 难 真 正 做 
到 三 盲 。 
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三 、 非 盲 法 评定 

(一 ) 定义 

非 盲 法 评定 ,又 称 为 开放 试验 (open trial), 即 受 试 对 象 和 研究 者 均 知晓 试验 组 和 对 照 组 的 
分 组 情况 , 以 及 所 给 予 的 干预 措施 。 

并 非 所 有 临床 研究 都 适用 讶 法 , 例如 , 比较 手术 疗法 和 保守 疗法 的 治疗 效果 , 探讨 功能 训 
练 或 针灸 疗法 的 疗效 ,评定 生活 习惯 (吸烟 运动 .饮食 ) 对 疾病 的 影响 等 。 在 这 种 情况 下 , 盲 法 
试验 难以 实施 , 只 能 采用 非 盲 法 评定 ; 另外 , 若 主要 结局 指标 是 明确 的 硬指标 (如 存活 或 死亡 )， 
很 少 受 主观 因素 影响 , 采用 非 盲 法 评价 也 可 以 获得 比较 满意 的 结果 。 

(二 ) 适用 范围 

1. 在 一 次 研究 中 , 需要 对 多 种 因素 进行 分 析 。 如 不 仅 希望 观察 药物 的 疗效 , 同时 也 要 评价 
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影响 疗效 或 发 病 的 有 关 因 素 。 

2. 研究 者 希望 更 安全 、 更 周到 地 作出 决策 (例如 患者 是 否 需 要 继续 治疗 , 药物 是 否 需要 增 
减 , 是 否 需要 配合 其 他 药物 等 ), 使 医疗 决策 更 灵活 。 

(三 ) 优 缺 点 

1. 易于 设计 和 实施 , 研究 者 了 解 分 组 , 便于 对 受 试 对 象 及 时 作出 处 理 。 

2. 最 主要 的 缺点 是 容易 产生 测量 偏 倚 。 
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一 . 概 述 


科学 技术 方法 在 21 世纪 取得 了 迅猛 发 展 , 并 越 来 越 多 地 运用 于 医学 研究 各 领域 , 这 对 增进 
人 类 健康 、 提 高 生活 质量 、 预 防 和 治疗 疾病 等 均 发 挥 了 巨大 的 作用 。 同 时 , 以 人 体 为 研究 对 象 
的 临床 研究 也 极 易 引发 一 系列 伦理 学 问题 。 从 Tuskegee 梅毒 研究 、Willowbrook 肝炎 研究 等 案 
例 来 看 ,违背 医学 伦理 的 科学 研究 , 无 论 研究 结果 如 何 , 终 将 会 受到 全 人 类 的 遗 责 。 
医学 伦理 的 基础 是 由 《 希 波 克 拉 底 誓言 ) 发 展 而 来 的 《日 内 瓦 宣言 》, 该 宣言 对 一 名 医生 的 医 
疗 行为 提出 了 伦理 学 准则 并 在 1948 年 世界 医师 协会 大 会 上 正式 通过 , 而 在 1975 年 世界 卫生 大 
会 上 提出 的 《赫尔辛基 宣言 》 则 针对 医学 研究 中 的 伦理 学 问题 做 出 了 规范 。20 世纪 90 年 代 后 ， 
我 国 国家 食品 药品 监督 管理 局 结合 本 国 实际 情况 , 发 布 的 《药品 临床 实验 管理 规范 (GCP)》 对 药 
品 研究 中 临床 实验 阶段 所 涉及 的 伦理 问题 也 做 出 了 明确 规范 。 
临床 研究 以 人 体 (病人 ) 为 受 试 对 象 , 在 研究 过 程 中 不 可 避免 地 会 涉及 伦理 学 问题 。 但 每 项 
医学 研究 都 必须 在 获取 科学 结论 与 维护 受 试 者 利益 间 和 寻找 一 个 最 佳 平衡 点 , 使 医学 科学 真正 造 
福 于 人 类 。 



































二 、 临 床 研究 立项 中 的 伦理 基础 


临床 研究 中 无 论 是 新 的 预防 、 诊 断 和 治疗 方法 效果 研究 , 还 是 病因 与 病理 生理 研究 都 必须 
遵循 “受益 大 于 风险 "原则 , 即 有 利于 增进 人 类 健康 , 尽 可 能 避免 各 种 潜在 风险 的 基本 原则 。 

为 了 切实 达到 上 述 目标 , 在 研究 立项 前 , 应 做 大 量 的 文献 复习 , 并 进行 循 证 分 析 与 决策 。 
只 有 在 大 量 证 据 证 明 研 究 的 必要 性 及 预期 获 益 超过 其 所 带 来 的 风险 和 损害 时 , 研究 才 有 了 立项 
的 基础 。 

研究 设计 完成 后 , 必须 报 伦理 委员 会 审批 。 报 送 材料 中 应 对 所 有 涉及 人 体 环节 的 研究 过 
程 、 实 施 方法 、 潜 在 风险 及 控制 措施 等 方案 真实 、 完 整 呈 现 , 以 便 委员 会 专家 做 出 客观 判定 。 

同时 , 临床 研究 者 必须 由 合格 的 科研 人 员 承 担 , 并 至 少 在 1 名 以 上 具有 丰富 临床 经 验 的 医 
生 监 督 下 进行 , 以 确保 病人 的 安全 。 

三 、 临 床 研究 中 的 伦理 学 原则 

(一 ) 尊重 (respect) 原 则 

尊重 原则 的 主要 内 涵 在 于 , 医学 研究 应 充分 尊重 受 试 者 的 人 格 及 其 作为 一 个 自主 个 体 所 应 
享有 的 权利 。 尊 重 原则 县 体 体现 在 以 下 几 方面 : 

1. 知情 (informed ) 研究 者 应 向 受 试 对 象 阐明 研究 的 目的 .方法 .实施 过 程 、 经 费 来 源 及 研 
究 可 能 带 来 的 利 棘 风险 , 让 受 试 者 有 充分 的 时 间 了 解 加 入 研究 项 目 对 其 自身 的 意义 和 价值 所 
在 , 以 便 做 出 理性 的 决定 。 

2. 自愿 (voluntary) 对 于 有 自主 行为 能 力 的 受 试 者 , 必须 在 其 完全 自愿 的 情况 下 签署 《 知 
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情 同 意 书 》(Informed Consent Form), 并 告知 他 们 有 拒绝 参加 研究 或 无 条 件 随 时 收回 同意 书 的 权 

利 。 对 于 自主 性 受 限 的 对 象 (儿童 、 氏 迷 者 、 痴 呆 者 等 ), 研究 者 必须 按 法 律 规定 从 合法 代理 人 处 

获取 知情 同意 。 同 时 , 在 临床 研究 中 为 避免 受 试 对 象 (病人 ) 因 迫 于 研究 者 (医生 ) 压 力 而 被 迫 同 

意 参与 试验 的 情况 发 生 , 应 由 一 位 了 解 情况 但 不 参与 研究 的 独立 第 三 方 来 征询 对 象 的 知情 
| 3. 保密 (confidential) 研究 者 应 对 受 试 对 象 的 个 人 信息 、 健 康 状况 、 行 为 习惯 等 资料 严格 
| 保密 , 未 经 本 人 同意 , 不 得 将 受 试 对 象 的 个 人 信息 公开 , 应 充分 尊重 其 隐私 权 。 

(二 ) 受益 (beneficence ) 原 则 

受益 原则 主要 体现 在 两 个 方面 : 

1. 在 研究 过 程 中 , 应 尽量 保证 受 试 者 受益 最 大 化 、 风 险 最 小 化 。 如 尽量 避免 侵入 性 操作 ， 
抽 血 量 降 至 最 低 。 医 务 人 员 应 密切 观察 受 试 对 象 的 病情 变化 , 一 旦 发 现 潜在 风险 大 于 可 能 的 受 
益 或 已 经 得 出 预期 结果 , 应 立即 终止 试验 。 

2. 研究 得 出 确切 结论 后 , 应 确保 每 个 参加 试验 的 病人 能 够 利用 课题 所 证 实 的 最 好 的 预防 、 
诊断 和 治疗 方法 。 如 在 疗效 研究 中 一 旦 证 实 试 验 组 所 用 的 新 药 疗效 优 于 常规 药物 , 则 在 试验 结 
束 后 应 该 让 对 照 组 患者 也 使 用 新 药 。 

(三 ) 公正 (justice ) 原 则 
| 公正 原则 要 求 研究 者 在 确定 研究 对 象 时 , 应 该 遵循 科学 原理 , 设立 合理 的 入选 标准 、 排 除 

标准 和 剔除 标准 , 不 应 该 只 是 针对 弱势 群体 ( 老 幼 、 残 障 、 囚犯 有 色 人 种 等 )。 其 次 , 在 分 配 受 
试 对 象 到 不 同 试验 组 时 , 应 不 分 亲 朴 , 一 视 同仁 。 分 配 前 应 告知 对 象 可 能 被 分 配 到 试验 的 不 同 
| 组 别 , 并 说 明 分 组 原则 与 方法 。 




















第 五 节 ”临床 研究 中 的 偏 倚 及 质量 控制 


一 概述 

除 少数 直接 以 目标 总 体 为 对 象 进行 的 研究 ( 某 有 限 总 体 疾病 或 健康 情况 普查 、 特 殊 病例 报 
告 等 ) 外 , 绝 大 多 数 临床 研究 为 抽样 研究 , 即 用 样本 结果 来 推断 总 体 情 况 。 在 生物 多 样 性 彰 景 
下 ,样本 测量 值 与 总 体 真 实 值 是 不 等 的 , 这 种 差异 在 统计 学 上 称 误差 (errors )。 

医学 研究 中 的 误差 来 自 两 个 方面 : 一 是 因 抽 样本 身 导致 的 误差 , 即 统计 学 上 的 抽样 误差 
(sampling errors )。 抽 样 误差 与 抽样 研究 是 相伴 相 随 、 不 可 避免 的 ,该 类 误差 因 没有 方向 性 且 哇 
随机 变化 , 又 称 为 随机 误差 (random error), 可 以 通过 扩大 样本 量 或 提高 随机 抽样 质量 来 尽量 使 
抽样 误差 降 至 最 低 , 统计 学 上 常用 标准 误 描述 其 大 小 ( 详 见 统计 学 相关 章节 ), 以 帮助 正确 判断 
抽样 误差 对 结果 的 影响 。 

导致 误差 的 另 一 方面 原因 是 偏 倚 (bias)。 偏 倚 指 抽样 误差 以 外 的 , 因 研究 设计 、 测 量 、 资 料 
分 析 及 结果 解释 等 临床 研究 各 个 环节 中 所 发 生 的 系列 错误 , 导致 研究 结果 系统 性 偏离 真实 值 。 
偏 倚 导 致 的 误差 又 称 为 系统 误差 (systematic error), 有 方向 性 , 即 某 种 错误 导致 样本 均 数 / 率 系 
统 性 高 于 或 低 于 总 体 参数 , 也 可 能 是 系统 性 压 大 或 减弱 研究 因素 与 结果 间 的 关联 强度 , 从 而 影 
响 结果 的 真实 性 。 偏 估 所 致 的 误差 是 不 能 通过 扩大 样本 量 来 控制 的 。 由 于 偏 集 是 研究 中 的 各 
种 错误 所 造成 的 , 按 其 产生 的 原因 可 将 偏 倚 分 为 选择 偏 倚 、 信 息 偏 倚 、 混 杂 偏 倚 三 类 。 


二 选择 偏 倚 














(一 ) 选择 偏 倚 的 概念 
选择 偏 倚 ( selection bias ) 是 指 在 选取 研究 对 象 时 , 由 于 选取 的 方法 不 当 , 使 人 选 的 研究 对 象 
与 未 人选 者 在 某 些 特征 上 存在 着 差异 而 造成 的 一 种 系统 误差 。 
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选择 偏 倚 主 要 发 生 在 研究 的 设计 阶段 , 当 确定 研究 样本 或 选择 比较 组 时 ,未 严格 遵循 随机 
原则 , 或 设置 的 纳入 /排除 标准 不 恰当 。 如 探讨 高 血压 与 血脂 异常 的 关系 时 , 研究 对 象 全 部 来 
自 心 内 科 住 院 患 者 ,或 者 采用 自身 前 后 对 照 设计 评价 某 减 肥 药 疗效 时 ,研究 对 象 全 部 为 自愿 者 ， 
以 上 两 种 情况 均 可 能 夸大 研究 因素 与 研究 结果 间 的 关联 强度 .产生 正 偏 。 

另外 ,在 信息 收集 过 程 中 也 可 产生 选择 偏 倚 , 如 无 应 答 、 失 访 例 数 较 多 而 又 未 采取 有 效 的 
处 理 措施 , 若 仅 以 资料 完整 对 象 进行 分 析 , 也 可 造成 结果 高 估 。 

(二 ) 常见 来 源 举 例 

1. 入 院 率 偏 傈 (admission rate bias ) 人 院 率 偏 倚 又 称 伯 克 森 偏 倚 (Berkson's bias ), 指 当 研 
究 对 象 全 部 来 自 医院 的 住院 或 门诊 病例 时 , 可 能 因 患 有 某 种 疾病 或 具有 某 种 特征 者 人 院 机 会 较 
月 标 人 群 不 同 , 而 导致 的 一 种 偏 倚 。 例 如 , 研究 呼吸 道 疾 病 与 骨 及 运动 器 官 疾病 的 相关 性 , 由 
于 同时 具有 呼吸 道 疾病 及 骨骼 与 运动 器 官 疾病 的 患者 入 院 或 就 诊 机 会 较 高 , 因此 在 医院 选择 研 
究 对 象 时 , 会 夸大 两 者 之 间 的 关联 度 , 见 表 3-2。 


表 3-2 ”呼吸 道 疾病 及 骨骼 与 运动 器 官 疾病 相关 性 研究 

















骨骼 与 运动 器 官 疾病 
呼吸 道 疾 病 一 般 人 群 住院 6 个 月 以 上 患者 
有 无 合计 有 无 合计 
有 17 207 224 5 15 20 
无 184 2376 2560 18 219 237. 
合计 201 2583 2784 23 234 257 





OR Ap=106,OResas=406, 可 见 ,在 一 般 人 群 中 呼吸 道 疾 病 与 骨骼 肌 运 动 器 官 疾病 间 
相关 性 很 弱 , 而 以 住院 6 个 月 以 上 者 为 研究 对 象 时 , 两 者 间 显 示 有 很 强 的 联系 。 

2. 现 患 - 新 病例 偏 位 (prevalence-incidence bias ) 现 患 -新 病例 偏 倚 又 称 奈 曼 偏 倚 (Neyman 
bias), 发 生 在 研究 对 象 全 部 或 大 部 分 为 现 患 病例 (老病 例 和 新 病例 ) 时 。 现 患 病例 与 新 病例 相 
比 , 在 病程 、 病 情 、 病 型 等 方面 可 能 存在 差异 , 特别 是 当中 可 能 有 较 多 “生物 学 上 的 强 者 "时 , 可 
出 现 病例 选择 偏 傈 。 

3. 检 出 症候 偏 倚 (detection signal bias ) 指 在 病因 研究 中 ， 某 种 疾病 的 一 些 早期 症状 可 能 与 
研究 的 暴露 因素 相关 , 因此 , 出 现 这 些 早期 症状 的 人 会 及 早 就 诊 , 并 接受 检查 而 导致 该 人 群 有 
较 高 的 疾病 检 出 率 , 以 致 得 出 暴露 因素 与 某 病 相 关 的 错误 结论 , 或 夸大 两 者 之 间 的 关联 度 。 例 
如 子宫 内 膜 癌 的 病因 研究 , 车 研究 对 象 来 自 医院 门诊 时 , 得 出 服用 雌 激 素 是 主要 病因 的 结论 ， 
但 在 普通 人 群 中 研究 时 , 两 者 关联 明显 减弱 。 进 一 步 研究 发 现 , 服用 峻 激素 可 引起 阴道 不 规则 
出 血 , 这 部 分 人 会 及 早 地 到 医院 就 诊 , 因此 , 大 大 提高 发 现 其 患 有 子宫 内 膜 癌 的 机 会 。 

4. 排除 偏 倚 (exclusive bias) 指 研究 中 “无 应 答 ”、 失 访 或 “不 依从 "者 较 多 , 若 直 接 剔 除 该 
部 分 人 资料 , 仅 用 余下 资料 进行 分 析 而 带 来 的 一 种 偏 集 。 这 是 因为 被 排除 对 象 与 余下 的 对 象 可 
能 存在 明显 差异 。 如 在 疗效 研究 中 , 疗效 差 或 不 良 反应 较 大 者 更 容易 失 访 而 被 排除 在 分 析 之 外 。 

5. 易 感性 偏 倚 (susceptibility bias) 当 研究 对 象 过 于 集 中 在 某 一 类 特定 人 群 , 如 以 油漆 生 
产 车 间 工 人 为 对 象 , 研究 油漆 与 皮肤 过 敏 间 的 关系 , 可 能 会 发 现 这 一 组 人 群 过 敏 性 皮炎 的 发 生 
率 并 不 比 其 他 人 群 高 。 这 里 面 应 考虑 纳入 对 象 的 特殊 性 , 如 因 自然 淘汰 , 能 够 留 在 该 车 间 工 作 
者 可 能 多 是 对 油漆 刺激 不 易 感 者 。 

(三 ) 选择 偏 倚 的 防止 

在 不 同 研究 中 因 目 的 不 同 ,产生 选择 偏 倚 的 原因 也 不 相同 。 防 止 选择 偏 倚 主 要 从 以 下 几 方 
面 入手: 

1. 当 研究 目的 确定 后 , 需 广泛 查阅 文献 , 反复 讨论 可 能 出 现 选 择 偏 倚 的 各 种 情况 , 从 源头 














笔记 
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上 加 以 避免 ; 

2. 尽量 在 一 般 人 群 中 选择 研究 对 象 ,或 设计 多 组 对 象 以 控制 选择 偏 倚 的 发 生 ; 

3. 纳入 对 象 或 分 组 时 , 尽量 做 到 随机 化 ， 

4. 尽量 减少 “无 应 答 "、 失 访 或 “不 依从 ”情况 , 一般 要 求 控制 在 15% 以 内 。 若 确 有 较 多 “无 
应 答 ”、 失 访 或 “不 依从 ”者 , 需 从 这 类 对 象 中 随机 抽取 部 分 个 体 , 千方百计 收集 到 他 们 的 资料 ， 
并 将 其 与 应 答 完整 或 随访 完整 者 的 资料 进行 比较 , 若 两 部 分 对 象 在 影响 研究 结果 的 因素 上 无 显 
闭 差 异 , 则 可 用 资料 完整 者 资料 进行 分 析 , 反之 则 表明 存在 偏 倚 的 可 能 性 较 大 。 


三 .信息 偏 倚 

(一 ) 信息 偏 倚 的 概念 

信息 偏 倚 (information bias ) 又 叫 测量 偏 倚 (measurement bias ) 或 观察 偏 倚 (observational bias )， 
指 在 收集 对 象 暴露 特征 、 随 访 及 结局 信息 时 错误 地 把 一 类 信息 归 为 另 一 类 信息 所 造成 的 系统 
误差 。 

信息 偏 倚 主 要 发 生 在 研究 的 实施 阶段 , 其 产生 的 原因 主要 有 三 个 方面: @D 来 自 研究 对 象 。 
研究 对 象 可 能 由 于 主观 或 客观 的 原因 有 意 或 无 意 提供 不 真实 信息 , 如 孕妇 有 意 隐瞒 饮酒 史 , 慢 
性 病 患者 忘记 曾经 服用 某 种 药物 等 。@ 来 自 研 究 者 。 研 究 者 也 有 可 能 因 主观 原因 有 意 或 无 意 
地 选择 性 收集 与 接收 某 些 信息 , 造成 信息 偏 倚 。 如 研究 者 一 般 都 希望 得 到 阳性 研究 结果 , 对 暴 
露 者 的 暴露 相关 信息 的 挖 据 和 收集 比 对 非 暴露 者 更 加 深入 、 全 面 , 从 而 造成 夸大 暴露 与 结局 间 
联系 的 误差 。@@ 来 自 研究 中 使 用 的 测量 仪器 或 工具 。 如 果 研 究 使 用 的 测量 仪器 或 工具 本 身 存 
在 测量 误差 则 必然 导致 研究 结果 的 系统 误差 。 

(二 ) 常见 来 源 举例 

1. 回忆 偏 倚 (recall bias) 在 进行 问卷 调查 时 , 被 调查 者 可 能 因 记 忆 不 准确 , 对 以 往 的 疾病 
中 、 用 药 史 或 家 族 史 等 情况 提供 错误 信息 而 导致 偏 侍 。 回 忆 偏 倚 较 多 天 倾向 性 ,如 回忆 吸烟 情 
况 , 可 能 偏 多 , 也 可 能 偏 少 , 其 结果 往往 会 减弱 研究 因素 与 结局 间 的 关联 强度 , 产生 负 偏 。 

2. 报告 偏 从 (reporting bias) 指 研究 对 象 可 能 出 于 各 种 原因 故意 隐瞒 或 谎报 某 些 信息 而 导 
致 的 偏 倚 。 如 一 些 心血 管 病 患者 故意 隐瞒 吸烟 饮酒 史 等 ,造成 某 药物 疗效 评价 失真 。 

3. 暴露 怀疑 偏 倚 (exposure suspicion bias) 暴露 怀疑 偏 倚 主 要 来 自 研 究 者 。 如 研究 某 因素 
与 一 种 疾病 的 关系 时 , 研究 者 从 主观 上 认为 两 者 有 联系 并 希望 出 现 阳性 结果 , 因此 在 收集 基本 
情况 或 随访 信息 时 ,会 下 意识 的 过 度 挖掘 病例 组 的 暴露 信息 而 忽略 对 照 组 的 暴露 信息 。 暴 需 怀 
疑 偏 倚 往 往 会 夸大 研究 因素 与 研究 结果 间 的 关联 度 , 造成 正 偏 。 

4. 诊断 怀疑 偏 倚 ( diagnostic suspicion bias) 在 病因 研究 或 预后 研究 中 ， 被 研究 首 因 被 确定 
有 某 种 暴露 或 患 有 某 种 疾病 , 在 主观 因素 影响 下 , 会 有 意 无 意 地 强调 或 判断 自己 已 有 相应 症状 
或 结果 事件 发 生 , 从 而 导致 夸大 因果 联系 的 错误 结论 。 

5. 检测 偏 倚 (detection bias) 检测 偏 倚 指 因 检 查 测量 仪器 误差 或 操作 不 当 而 导致 的 系统 

(三 ) 信息 偏 倚 的 防止 

根据 信息 偏 倍 产 生 的 原因 ,防止 信息 偏 倚 主 要 从 以 下 几 方 面 进行 : 

1. 研究 者 对 拟 进行 的 研究 要 事先 制定 明细 的 资料 收集 方法 。 如 设计 统一 而 明确 的 调查 
表 , 对 调查 内 容 或 测量 指标 规定 明确 客观 的 标准 , 避免 模 楼 两 可 的 提问 , 尽量 采用 定量 指标 收 

2. 研究 正式 实施 前 ,对 调查 员 进 行 精心 挑选 和 严格 培训 , 让 调查 员 充 分 了 解 每 个 问题 的 设 
置 目的 、 内 涵 , 掌握 收集 信息 的 要 领 和 技巧 ; 

3. 尽量 采用 “ 双 讶 法” 收集 信息 , 避免 因 研究 考 或 研究 对 象 的 主观 因素 带 来 暴露 怀疑 偏 倚 、 
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诊断 怀疑 偏 倚 等 , 影响 信息 真实 性 ; 
4. 研究 实施 前 , 对 所 使 用 的 仪器 设备 进行 校正 ; 
5. 设计 严格 的 质量 控制 手段 , 以 及 恰当 实用 的 质量 监测 、 控 制 措施 (如 调查 员 签名 、 复 查 等 )。 


四 .混杂 偏 倚 


(一 ) 混杂 偏 倚 的 概念 

混杂 偏 倚 (confounding bias ) 也 可 简称 为 混杂 (confounding), 是 指 由 于 有 一 个 或 多 个 潜在 外 
部 因素 的 存在 , 夸大 或 掩盖 了 研究 因素 与 结局 之 间 的 真实 联系 , 出 现 错误 估计 结果 。 这 些 潜在 
的 外 部 因素 (extraneous factor ) 称 为 混杂 因素 (confounding factor)。 

混杂 因素 是 导致 混杂 偏 倚 的 关键 , 它 具备 三 个 基本 特点 : @ 混 杂 因 素 本 身 就 是 一 个 独立 的 、 
与 研究 结局 有 关联 的 因素 ; @ 混 杂 因 素 与 研究 因素 之 间 也 必须 相关 ; @ 它 不 是 研究 因素 与 研究 
结局 因果 链 上 的 一 个 中 间 环 节 。 以 病因 研究 为 例 , 当 探 讨 某 暴露 因素 E(exposure factor ) 与 疾病 
D(disease ) 的 相关 性 时 , 另 有 1 个 因素 F(factor), 它 既是 疾病 D 的 一 个 独立 的 危险 因素 , 同时 又 
与 暴露 因素 E 呈正 相关 ,F 因素 的 存在 意味 着 暴露 组 必然 有 较 高 的 疾病 D 发 病 率 。 因 此 , 无 论 
F 与 D 之 间 是 否 真 正 有 因果 联系 , 都 会 得 出 暴露 组 发 病危 险 性 高 于 非 暴露 组 的 结论 。 

例如 , 某 队列 研究 探讨 服用 维生素 下 与 震 患 心肌 梗死 间 的 关系 , 通过 随访 得 到 表 3-3 所 示 
数据 。 





表 3-3 心肌 梗死 与 服用 维生素 E 相关 性 研究 














心肌 梗死 
服用 维生素 E 二 证 合计 
服用 400 600 1000 
未 服用 600 400 1000 
合计 1000 1000 2000 





统计 显示 , RR=0.4/0.6=0.67, 显示 服用 维生素 E 者 发 生 心肌 梗死 的 危险 性 较 小 , 在 有 统计 
学 意义 的 条 件 下 , 可 以 得 出 服用 维生素 EE 对 心肌 梗死 有 保护 作用 的 结论 。 但 是 这 一 结果 可 能 受 
到 “吸烟 " 这 个 外 部 因素 的 干扰 。 那 么 , 在 本 研究 中 吸烟 这 个 因素 是 否 会 导致 混杂 偏 傈 呢 ? 可 通 
过 以 下 分 析 来 判断 : 

首先 , 分 析 心肌 梗死 发 生 是 否 与 吸烟 有 关 。 通 过 随访 记录 上 的 吸烟 情况 记录 发 现 ,2000 人 
中 ,吸烟 者 1150 人 , 心肌 梗死 发 病 率 约 为 71%, 不 吸烟 者 850 人 , 心肌 梗死 发 病 率 约 为 21%, 进 
一 步 结合 服 用 维生素 E 的 情况 , 得 到 表 3-4 所 示 数 据 。 


表 3-4 按 吸 烟 与 否 分 层 分 析 心 肌 梗死 与 服用 维生素 E 相关 性 











服用 维生素 E 组 不 服用 维生素 E 组 
吸烟 情况 心肌 梗死 心肌 梗死 
发 生 未 发 生 合计 发 生 未 发 生 合计 
吸烟 240 30 270 580 300 880 
不 吸烟 160 570 730 20 100 120 
合计 400 600 1000 600 400 1000 





通过 统计 分 析 得 到 : RR ju vr = 3.64, RR Rv 三 3.88, 以 上 结果 说 明 , 无 论 是 否 服用 维 生 
素 EE, 吸烟 与 心肌 梗死 都 有 很 强 的 联系 , 是 一 个 独立 的 危险 因素 。 
进一步 分 析 吸 烟 与 服用 维生素 眉 的 关系 , 得 到 表 3-5 所 示 数 据 。 
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表 3-5 吸烟 与 服用 维生素 相关 性 分 本 
服用 维生素 E 六 
豚 烟 情况 A 
服用 (%) 未 服用 (%) ee 
吸烟 270 (27) 880 (88) 1150 
不 吸烟 730 (73) 120 (12) 850 
合计 1000 《100) 1000 (100) 2000 








计算 得 : OR=0.05, 说 明 吸烟 与 服用 维生素 了 这 两 种 行为 间 存 在 明显 的 负 相 关 , 即 服用 维 
生 素 下 者 吸烟 较 少 。 

从 表 3-4 和 表 3-5 可 知 , 在 该 研究 中 , 吸烟 这 个 因素 满足 了 作为 混杂 因素 的 基本 条 件 , 可 能 
引起 混杂 偏 倚 。 

因此 ,判断 某 可 疑 混杂 因素 是 否 引 起 混杂 偏 倚 , 可 通过 比较 含 该 因素 时 研究 因素 与 结局 间 
的 粗 (crude ) 效 应 值 (如 cRR 或 <cOR ) 与 排除 该 因素 后 的 调整 (adiusted ) 效 应 值 (如 aRR 与 aOR) 
来 判断 。 若 数值 差别 过 大 , 说 明 存在 混杂 偏 倚 , 以 调整 效应 量 作为 研究 因素 的 纯 效 应 估计 值 。 

(二 ) 混杂 偏 倚 的 控制 | 

混杂 偏 倚 是 在 进行 组 间 比 较 时 , 因 混 杂 因 素 在 组 间 分 布 不 均 而 造成 的 。 如 研究 饮酒 与 肺癌 
的 关系 时 , 由 于 既 饮 酒 又 吸烟 者 居多 , 吸烟 作为 混杂 因素 , 可 导致 师 瘤 与 饮酒 有 关 的 错误 结论 或 
夸大 饮酒 与 肺癌 间 的 真实 联系 。 因 此 , 控制 混杂 偏 倚 主 要 从 研究 设计 与 资料 分 析 两 方面 和 人手: 

1. 设计 阶段 

(1) 分 组 时 必须 遵循 随机 化 原则 。 通 过 随机 分 组 , 可 以 相对 保证 混杂 因素 在 组 间 分 布 均衡 ， 
从 而 起 到 控制 混杂 偏 倚 的 作用 。 对 于 已 知 混杂 因素 , 可 以 采用 分 层 随机 的 方式 进行 分 组 , 以 达 
到 控制 混杂 偏 倚 的 目的 。 如 前 例 , 可 先 按 是 否 吸 烟 进行 分 层 , 然后 再 在 吸烟 人 群 与 非 吸烟 人 祝 
中 分 析 饮 酒 与 肺癌 的 关系 , 从 而 控制 吸烟 这 个 因素 对 研究 结果 的 影响 。 

〈2) 配 比 设计 。 采 用 配 比 对 照 的 方法 将 可 疑 混杂 因素 作为 配 比 因素 , 使 研究 组 与 对 照 组 在 
这 些 因素 上 保持 一 致 。 

(3) 对 研究 对 象 进行 限制 。 如 考虑 到 年 龄 可 能 成 为 混杂 因素 , 设计 时 可 将 研究 对 象 的 年 龄 
限制 在 某 一 年 龄 段 内 ; 若 性 别 可 能 是 混杂 因素 , 可 仅 以 男性 或 女性 为 研究 对 象 , 以 消除 性 别 对 
研究 结果 的 影响 。 

2. 资料 分 析 阶 段 

(1) 对 资料 进行 分 层 分 析 。 在 资料 收集 之 后 , 按 可 疑 混杂 因素 进行 分 层 , 通过 比较 分 层 前 后 
的 效应 值 (cRR 与 aRR 、cOR 与 aOR) 来 识别 其 混杂 作用 及 其 大 小 。 

(2) 利用 标准 化 法 ( 率 的 标 化 ) 进 行 调整 。 如 欲 比较 甲乙 两 县 某 因素 峻 句 人群 的 发 病 率 ( 生 
态 性 研究 ), 为 消除 年 龄 构成 不 同 带 来 的 影响 , 可 对 两 县 人 口 发 病 率 按 年 龄 进行 标 化 , 以 消除 年 
龄 因素 对 研究 结果 的 影响 。 

(3) 利用 多 因素 分 析 方 法 。 采 用 多 因素 分 析 方 法 ,将 混杂 因素 与 研究 因素 一 并 纳入 分 析 。 
即 通过 一 个 数学 模式 把 所 有 相关 因素 (包括 多 种 混杂 因子 ) 对 某 一 结局 的 影响 进行 定量 综合 分 
析 。 多 因素 统计 分 析 方法 包括 多 元 线性 回归 , 逐步 回归 ,logistic 回归 , Cox 风险 比例 模型 等 。 

( 李 划 ) 
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临床 研究 结果 要 转化 为 高 质量 的 循 证 医学 实践 证 据 , 最 有 效 的 方法 之 一 就 是 研究 之 前 进行 
严格 的 科研 设计 , 尽 可 能 地 控制 和 减少 非 研究 因素 造成 的 偏 倚 , 如 患者 的 不 同文 化 水 平 、 经 济 
地 位 , 不同 病程 、 病 情 程度 , 不 同 医疗 护理 水 平等 已 知 或 未 知 影响 因素 。 因 此 , 选择 与 研究 课题 
相 适 应 的 、 论 证 强度 高 且 可 行 性 好 的 设计 方案 是 保证 临床 研究 质量 的 关键 所 在 。 

通常 将 临床 研究 的 设计 方案 分 为 两 大 类 : 观察 性 研究 (observational studies ) 和 实验 性 研究 
(experimental studies )o 观察 性 研究 与 实验 性 研究 最 主要 的 区 别 在 于 研究 者 不 能 人 为 地 控制 试 
验 条 件 , 不 同比 较 组 别 系 自然 形成 , 只 能 尽 可 能 控制 非 研究 因素 的 影响 , 以 求 结 论 的 真实 、 可 
和 车。 观察 性 研究 进而 又 可 分 为 分 析 性 研究 (analytical studies ) 和 找 述 性 研究 (descriptive studies ) 
等 。 实 验 性 研究 则 可 人 为 控制 试验 条 件 , 如 随机 分 组 .根据 研究 目的 设置 合理 的 对 照 、 盲 法 观 
测 结果 等 , 以 探讨 干预 或 治疗 措施 的 真实 效果 。 实 验 性 研究 也 可 分 为 临床 试验 (clinical trials ) 和 
类 实验 研究 (duasi-experimental studies ) 等 。 相 对 而 言 , 实验 性 研究 的 论证 强度 更 高 ， 结论 更 为 可 
靠 。 表 4-1 列 出 了 临床 研究 设计 的 常见 方案 及 其 证 据 级 别 。 本 章 将 分 别 介绍 这 些 设计 方案 的 概 
念 、 特 点 、 设 计 异 式 、 实 施 方案 .资料 的 整理 与 分 析 、 应 用 范围 和 优 缺 点 . 以 使 于 大 家 在 临床 研究 
实践 中 选用 。 








染 4-1 ”临床 研究 设计 的 常见 方案 及 其 江 深 等 级 














1. 实验 性 研究 
(2)- 临 床 试 验 la~2b 
2b~2¢ 
t 3a~ 才 
试验 2e~3a 





I(b)- 类 实验 研究 自身 前 后 对 照 试 验 3a~3b 
有 观察 性 研究 


IT(a)- 分 析 性 研究 队列 研究 1b~2b 
病例 对 照 研究 3a~3b 
了 (b)- 模 述 性 研究 横断 面 研究 3b~4 
病例 报告 4 
本 个 二 oD ME (Es 











分 级 标准 


”GRADE( Crading of Recovmmaendations Assessment, Development and Evaluatiun )i 





第 一 节 ”随机 对 照 试验 


概述 
(一 ) 定义 
随机 对 照 试验 (randomized controlled trial, RCT ) 是 采用 随机 化 的 方法 , 将 合格 的 研究 对 象 分 
别 分 配 到 试验 组 和 对 照 组 , 然后 接受 相应 的 试验 措施 , 在 一 致 的 条 件 下 或 环境 中 , 同步 地 进行 
研究 和 观测 试验 的 效应 , 并 用 客观 的 效应 指标 对 试验 结果 进行 科学 的 测量 和 评价 。 
39 
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(二 ) 历史 回顾 

17 世纪 了. Bacon 就 提出 应 该 “通过 试验 来 尝试 或 证 实 特 定 疾病 疗法 的 效果 "。18 世纪 
G. Berkeley 提出 对 照 临床 试验 的 观点 。 早 期 的 流行 病 学 实验 主要 是 针对 病人 进行 的 , 如 18 志 
纪 丁 Lind 关于 坏 血 病 的 治疗 试验 , 19 世纪 高 木 兼 宽 关 于 脚气 病 的 治疗 试验 , 以 及 20 世纪 初 
本 Goldberg 关于 燥 皮 病 的 治疗 试验 。 “实验 流 行 病 学 最早 就 是 指 实验 动物 (大 白鼠 小 鼠 ) 群 的 
传染 病 流行 模型 研究 , 如 20 世纪 20~30 年 代 英 国 的 Topley、Wilson 和 Greenwood , 德国 的 Neufeld 
以 及 美国 的 Webster 等 都 曾 报道 了 动物 群 的 传染 病 ( 伤寒 , 肺炎 ) 流 行 模型 的 经 典 研究 , 发 现 疾 
病 流行 同 易 感动 物 所 占 比 例 以 及 动物 间接 触 程度 有 关 。 严 格 意义 上 的 对 照 组 (控制 组 ) 必 须 涉 
及 随机 分 配 , 一 般 公 认为 B. Hl 是 随机 对 照 试 验 之 父 。 他 设计 的 链 霉 素 治疗 肺结核 效果 评价 方 
案 , 于 1946 年 由 英国 医学 研究 会 实施 。1958 年 美国 开始 有 随机 对 照 试验 方法 的 临床 研究 报道 。 

近 50 多 年 来 , 随 着 理论 和 方法 的 日 趋 成 熟 , 随机 对 照 试验 被 公认 为 评价 干预 措施 疗效 的 金 标 
准 或 标准 方案 而 广泛 应 用 于 临床 研究 中 , 为 疾病 治疗 、 预 防 和 康复 提供 了 大 量 真实 、 可 靠 的 依据 。 

(三 ) 随机 对 照 试验 在 临床 研究 和 临床 实践 中 的 作用 和 价值 

随机 对 照 试验 研究 的 新 成 果 、 新 发 现 , 极 大 影响 着 人 们 的 临床 实践 活动 。 既 往 认为 有 效 的 
治疗 措施 经 随机 对 照 试验 证 实 无 效 。 过 去 , 某 种 治疗 措施 或 药物 是 否 应 用 于 临床 实践 , 主要 取 
决 于 专家 或 顾 间 的 意见 。 而 临床 医师 选择 治疗 措施 也 主要 基于 个 人 既往 治疗 患者 的 成 功 经 验 
或 对 疾病 的 病理 生理 学 机 制 的 理解 。 随 机 对 照 试验 能 够 对 某 种 治疗 措施 的 真正 疗效 或 副作用 、 
影响 因素 进行 科学 的 评判 。 

鉴于 疾病 发 病 机 制 的 复杂 性 和 对 疾病 认识 的 局 限 性 , 单纯 根据 疾病 的 病理 生理 机 制 、 实 验 
室 研究 结果 推断 某 种 干预 措施 在 人 体 的 疗效 , 有 时 可 能 误导 。 过 去 经 病理 生理 机 制 研 究 认为 有 
效 的 治疗 措施 , 可 能 经 RCT 证 实 无 效 或 有 害 。 例 如 , 从 疾病 的 病理 生理 进程 来 看 , 心肌 梗死 患 
者 发 生 室 性 心律 失常 是 独 死 的 重要 危险 因素 , 因此 有 充足 理由 对 此 类 患者 常规 使 用 抗 心 律 失常 
药物 ,但 随后 的 RCT 证 明 , I 类 抗 心 律 失常 药 虽 能 抑制 室 性 心律 失常 ,但 增加 了 病人 的 死亡 风 
险 ; 又 如 , 短 效 钙 持 抗 剂 尽管 能 有 效 降低 高 血压 患者 的 血压 水 平 , 但 心肌 梗死 和 死亡 风险 反而 
上 升 。 因 此 , 要 明确 某 种 治疗 措施 短期 和 长 期 的 临床 疗效 或 副作用 , 必须 进行 以 人 体 为 研究 对 
象 的 临床 对 照 试验 。 

(四 ) 随机 对 照 试 验 的 准 入 条 件 

1. 遵循 对 照 原则 ”由 于 生物 学 或 医学 的 研究 对 象 过 于 复杂 , 很 难 仅仅 通过 实验 室 或 其 他 
外 在 条 件 来 控制 干扰 , 因此 需要 将 一 部 分 研究 对 象 设置 为 对 照 组 或 控制 组 (control group)。 干扰 
组 上 , 通过 与 实验 组 比较 , 这 些 非 处 理 因素 的 作用 就 
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可 加 以 排除 。 

如 设 实验 (处 理 因素 ) 的 效应 为 T, 干扰 ( 非 处 理 因素 ) 的 效应 为 C, 则 : 

实验 (处 理 ) 组 表现 出 来 的 混合 效应 =T+C; 对 照 组 表现 出 来 的 效应 =C。 则 , 实验 (处 理 ) 的 
净 效 应 =(T+C)-C=T。 

如 果 有 两 种 处 理 (如 实验 处 理 和 标准 处 理 ) 的 效应 分 别 为 T1、T2, 则 : 

处 理 1 组 表现 出 来 的 混合 效应 =T1+C; 处 理 2 组 表现 出 来 的 混合 效应 =T2+C。 则 两 处 理 
组 净 效 应 差 值 =(T1+C)-(T2+C)=T1-T2 

这 样 ,利用 实验 (处 理 ) 组 与 对 照 组 的 比较 , 从 实验 (处 理 ) 组 的 混合 效应 中 分 离 出 归 因 
理 的 净 效 应 。 

需要 注意 的 是 : 实验 (处 理 ) 组 表现 出 来 的 混合 效应 (T+C), 是 通过 处 理 前 后 两 轮 测 量 值 之 
差 确定 的 。 如 处 理 为 降 血压 药 , 给 药 前 后 两 轮 血 压 测 量 值 之 差 , 就 是 降 血 压 药 组 表现 出 来 的 混合 
效应 (T+C)。 这 里 “ 降 血 压 药 组 给 药 前 ”并 没有 起 到 所 谓 对 照 的 作用 , 即 体现 出 非 处 理 因素 效应 
C。 如 果 不 存在 非 处 理 因素 的 干扰 (C=0), 那么 降 血 压 药 的 效应 (T) 就 等 于 两 轮 血压 测量 值 “自身 


于 处 
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前 后 ”比较 之 差 , 因而 就 不 需要 什么 “对 照 ”( 控 制 ) 了 , 即 成 了 “单纯 实验 设计 "(simple experiment 
design )。 这 常见 于 严格 控制 的 理化 实验 。 因 此 , 所 谓 “ 自 身 前 后 对 照 ”的 说 法 是 不 确切 的 。 

2. 遵循 随机 化 原则 ”随机 对 照 试 验 中 ， 采用 随机 化 (randomization ) 的 方法 制订 分 配方 案 5 
并 对 分 配方 案 进行 隐藏, 使 合格 的 研究 对 象 均 有 同等 机 会 进入 试验 组 或 对 照 组 , 不 以 研究 人 员 
或 研究 对 象 的 主观 意愿 为 转移 , 可 避免 选 择 偏 倚 的 干扰 。 在 样本 量 足够 大 的 情况 下 , 可 使 若干 
已 知 / 未 知 的 或 可 测 /不 可 测 的 混杂 因素 , 在 组 间 分 布 中 维持 相对 均衡 , 从 而 有 利于 基线 的 可 比 
性 。 如 果 样 本 量 不 够 大 , 则 不 能 保证 混杂 因素 在 组 间 均 匀 分 布 , 导致 基线 不 可 比 , 此 时 若 采 用 
分 层 随机 分 组 的 方法 ,也 可 实现 组 间 的 均衡 可 比 。 

3. 遵循 盲 法 原则 育 法 (blinding, masking ) 指 临床 试验 中 ， 不 让 受 试 者 、 研究 者 或 其 他 有 关 
工作 人 员 知 道 受 试 者 接受 的 是 何 种 处 理 (试验 药物 或 对 照 药物 ), 从 而 避免 他 们 对 试验 结果 的 干 
扰 。 受 试 者 若 知晓 自己 接受 的 是 何 种 药物 后 , 会 产生 各 种 心理 作用 , 影响 对 治疗 效果 的 准确 测 
量 。 研 究 或 观察 治疗 结果 者 知道 受 试 者 接受 的 是 何 种 处 理 , 会 自觉 或 不 自觉 地 干扰 他 们 对 治疗 
效果 的 判定 。 资 料 的 统计 分 析 人 员 知 道 受 试 者 接受 的 是 何 种 处 理 , 也 可 能 影响 他 们 对 资料 的 取 
舍 、 整 理 或 分 析 方 法 的 选择 等 。 根 据 盲 法 的 使 用 情况 , 可 以 将 临床 试验 分 为 开放 试验 、 单 言 i 
验 、 双 盲 试验 和 三 盲 试验 。 

(1) 单 盲 试验 (single blind trial): 指 仅 有 受 试 者 不 知道 自己 是 接受 何 种 处 理 的 试验 。 单 盲 法 
可 以 避免 来 自 受 试 者 方面 的 干扰 。 研 究 者 (疗效 观察 者 ) 知 道 处 理 分 配 情况 ,能 及 时 做 出 用 药 调 
整 ,对 患者 安全 有 利 ,但 不 能 避免 来 自 研究 工作 人 员 方 面 的 干扰 。 

(2) 双 讶 试验 (double blind trial): 指 受 试 者 和 研究 (疗效 观察 ) 者 均 不 知道 受 试 者 是 接受 的 
何 种 处 理 的 试验 。 当 疗效 和 安全 性 指标 受 主观 因素 影响 较 大 (如 精神 科 量 表 ) 以 及 需要 进行 综 
合 评价 (总 印象 ) 时 , 必须 使 用 双 讶 试验。 国家 食品 药品 监督 管理 局 规定 了 应 当 使 用 双 盲 法 的 临 
床 试验 范围 , 这 里 的 双 盲 法 指 受 试 者 和 研究 工作 人 员 “双方 ”处 于 盲 态 。 

(3) 三 盲 试验 (triple blind trial): 指 受 斌 者、 研究 (观察 ) 者 和 资料 统计 分 析 者 均 不 知道 受 试 
者 是 接受 的 何 种 处 理 的 试验 。 原 理 和 具体 实施 同上 述 。 

(4) 开放 试验 (open trial): 指 不 用 盲 法 的 试验 , 受 试 者 和 研究 者 及 有 关 工 作 人 员 都 知晓 受 试 
者 接受 的 是 何 种 处 理 , 如 手术 治疗 与 保守 治疗 的 效果 比较 试验 。 


二 .设计 模式 

















(一 ) 设计 模式 
随机 对 照 试 验 的 设计 模式 如 图 4-1 所 示 。 试 验 的 研究 对 象 必须 采用 公认 的 诊断 标准 加 以 
确定 , 既 可 从 患 病 群体 (目标 人 群 ) 中 随机 抽样 ,也 可 从 住院 或 门诊 患者 中 进行 连续 性 非 随机 抽 


| 
De Ee 


因 因果 联系 研究 时 向 a 


图 4-1 随机 对 照 试验 的 设计 模式 
N: 符合 公认 的 诊断 标准 的 病人 总 数 或 人 群 总 数 。 Ne: 该 人 群 或 病人 中 符合 纳入 标准 又 不 具备 排除 








Rs: 随机 分 配 或 分 层 后 随机 分 配 标准 的 人 数 
五 : 未 暴露 可 疑 致 病因 素 或 未 接受 防治 措施 的 对 ”下 : 暴露 可 疑 致 病因 素 或 接受 防治 措施 的 试验 组 
照 组 -十 : 为 随访 期 或 观察 期 , 中 间 填 时 间 


D: 发 病人 数 , 有 效 人 数 ,生存 数 等 D: 未 发 病人 数 , 无 效 人 数 , 死亡 数 等 





人 
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| 样 ,再 根据 事先 确定 的 纳入 和 排除 标准 , 选择 符合 标准 且 自 愿 参加 试验 的 患者 , 进而 采用 随机 


化 方法 将 合格 的 研究 对 象 随机 分 配 人 试验 组 或 对 照 组 , 接受 相应 的 干预 措施 , 经 过 一 段 恰 当 的 
观察 期 后 , 测量 治疗 后 的 效果 。 根 据 结果 的 资料 类 型 , 采用 相应 的 统计 学 方法 进行 分 析 、 处 理 
以 评价 干预 措施 的 真实 疗效 及 其 组 间 差 异 。 

(二 ) 结果 分 析 模 式 

根据 图 4-1 的 设计 模式 , 可 列 出 四 格 表 ( 表 4-2), 将 试验 组 和 对 照 组 的 结果 分 别 填 人 相应 的 
表格 内 , 对 两 种 干预 措施 的 疗效 进行 分 析 和 比较 评价 。 


表 4-2 ”随机 对 照 试 验 结果 分 析 四 格 表 











合计 

有 效 无 效 
试验 组 a b atb 
对 照 组 c d c+d 
合计 atc b+qd NY 





两 组 疗效 比较 可 采用 六 检验 或 Fisher 确切 概率 法 。 
三 、 实施 方 案 

(一 ) 研究 对 象 的 选择 

基于 不 同 的 研究 目的 , 选择 与 之 相 适应 的 研究 人 群 , 在 收集 目标 人 群 的 基线 资料 的 基础 上 ， 
按照 事先 制定 的 、 严 格 的 纳 和 人 和 排除 标准 来 选择 , 以 避免 某 些 外 来 因素 的 影响 。 选 搓 的 主要 原 
则 有 以 下 几 点 : 

1. 应 有 纳入 标准 和 排除 标准 “在 明确 的 疾病 诊断 标准 基础 上 , 根据 研究 目的 和 基体 条 件 ， 
对 受 试 者 制定 统一 的 纳入 和 排除 标准 。 若 纳入 标 准 宽松 , 受 试 者 代表 性 强 , 容易 推论 到 临床 实 
践 ,但 受 试 者 同 质 性 差 , 所 需 样本 量 大 , 否则 不 易 出 现 有 统计 学 意义 的 结果 。 若 纳 人 标准 产 格 ， 
则 受 试 者 同 质 性 好 , 容易 得 到 有 统计 学 意义 的 结果 , 但 推论 应 用 范围 受 限 。 因 此 , 在 制定 标准 
时 需要 综合 考虑 。 

2. 选择 干预 措施 有 效 且 可 以 获 益 的 人 群 ”要 考虑 受 试 者 的 具体 病情 , 使 得 他 们 既 能 从 该 临 
床 试验 中 获得 健康 效益 , 又 承担 较 小 的 风险 。 如 研究 抗 心 律 不 齐 药 物 疗 效 时 , 最 好 选择 近期 频 
繁 发 作 的 患者 , 偶发 患者 不 作 考 虑 ; 又 如 评价 某 疫苗 的 预防 效果 , 应 选择 某 病 高 发 区 的 易 感人 
群 为 研究 对 象 ; 再 如 评价 强化 补 碘 对 轻 度 缺 碘 区 居民 的 预防 效果 , 宜 选择 孕妇 和 儿童 。 

3. 选择 干预 对 其 无 害 的 人 群 ” 若 干预 对 其 有 潜在 伤害 , 不 宜 作为 研究 对 象 。 这 是 医德 伦理 
的 基本 要 求 。 如 有 胃 出 血 史 者 不 宜 选 作对 骨 有 和 刺激 性 药物 的 试验 研究 对 象 ; 而 可 能 出 现 较 大 出 
作用 的 对 象 也 不 宜 入 选 , 如 老 弱 者 或 危重 病人 等 。 

4. 选择 有 代表 性 的 人 群 ”在 上 述 原则 规定 的 范围 内 , 应 注意 所 选 人 群 的 代表 性 , 如 性 判 、 
年 龄 .种族 ,职业 等 特征 是 否 与 总 体 一 致 , 以 保证 研究 结果 的 外 部 真实 性 。 为 了 保证 研究 对 象 
的 代表 性 , 在 可 能 条 件 下 , 应 从 总 体 人 群 中 随机 选择 研究 对 象 。 

5. 选择 能 完成 试验 的 人 群 “在 试验 过 程 中 有 可 能 被 剔除 .不 能 完成 试验 者 不 宜 作为 研究 对 
象 。 例 如 用 阿司匹林 预防 老年 缺 血性 脑 血管 疾病 的 研究 , 常 将 全 并 有 癌症 者 或 有 胃病 者 排除 ， 
因为 这 些 人 可 能 在 研究 尚未 结束 前 即 发 生死 亡 或 因 副作用 过 大 而 被 迫 停止 试验 。 另 外 , 研究 对 
象 应 有 良好 的 依从 性 。 

6. 应 获得 受 试 者 的 知情 同意 书 ”这 是 医学 伦理 的 基本 要 求 。 

(二 ) 样本 量 估 计 

为 了 控制 工 .下 型 错误 率 , 在 试验 设计 阶段 ,就 应 对 研究 所 需 的 样本 量 加 以 估计 。 一 般 情 况 
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下 ,样本 量 越 大 , I 、 了 型 错误 率 就 越 低 ; 但 样本 量 过 大 , 不 仅 导 致 人 力 、 物 力 、 财力 和 时 间 的 浪 
费 , 而 且 会 给 试验 的 质量 控制 带 来 诸多 困难 。 

1. 影响 样本 大 小 的 主要 因素 

(1) 干预 措施 的 效应 大 小 :干预 措施 的 效应 越 大 , 试验 组 和 对 照 组 的 研究 事件 (疾病 ) 的 发 
生 率 的 差异 越 大, 所 需 样本 量 越 小 , 反之 , 所 需 样本 量 越 大 。 

(2) I 型 (x) 错 误 出 现 的 概率 : 即 出 现 假 阳性 错误 的 概率 。 确 定 的 a 越 小 , 即 要 求 的 显著 性 
水 平 越 高 , 所 需 样本 量 就 越 大 。 通 常 将 a 定 为 0.05。 

(3) 把 握 度 (1 一 B): 8 为 出 现 假 阴 性 错误 的 概率 ( I 型 错误 率 ), 1 -8 为 把 握 度 。 要 求 的 把 握 
度 越 高 , 则 所 需 样本 量 越 大 。 通 常 将 8 定 为 0.10。 

(4) 单 侧 检 验 或 双 侧 检验 : 单 侧 检验 比 双 侧 检验 所 需 样本 量 小 。 如 果 肯 定 试验 组 的 效果 好 
于 对 照 组 或 只 检验 当 试验 组 效果 优 于 对 照 组 时 , 就 用 单 侧 检 验 ; 否则 就 用 双 侧 检验 。 

(5 ) 研究 对 象 分 组 数量 : 通常 按 公式 估计 的 试验 样本 是 指 试验 组 和 对 照 组 分 别 所 需 的 例 数 。 
如 果 依 据 研究 目的 要 求 设立 了 多 个 试验 组 或 多 个 对 照 组 , 则 每 组 都 需 达到 估计 的 样本 数 。 因 
此 , 分 组 数量 越 多 , 则 所 需 总 样本 量 越 大 。 

2. 样本 量 计算 

(1) 计数 资料 的 样本 大 小 的 估计 : 如 果 结局 变量 是 计数 指标 , 如 发 病 率 、 感 染 率 .病死 率 和 
治 您 率 等 , 则 可 按 下 列 公式 计算 样本 量 : 











时 [zB0-P)+2, VRO-A) + BA-E)| ee 
CR- 
Pi: 对 照 组 某 结局 的 发 生 率 ; P,: 试验 组 某 结局 的 发 生 率 ; P: (Pi+P,)/2。 


纪 : 为 a 水 平 相应 的 u 值 ; 如 :为 B 水 平 相应 的 u 值 。 

N: 为 计算 所 得 一 个 组 的 样本 大 小 。 

(2) 计量 资料 的 样本 量 估计 : 如 果 结 局 变量 是 计量 资料 , 如 血压 、 血 糖 等 , 则 可 按 下 列 公式 
计算 样本 量 : 





N22 2 0 式 (4-2) 
0 

0: 为 估计 的 标准 差 ; d: 为 两 组 结局 变量 均值 之 差 ; Z,、2s 入 所 示意 义 同上 述 计数 资料 的 
计算 公式 。 

(三 ) 资料 收集 

在 随机 对 照 试验 中 , 应 对 所 有 的 研究 对 象 进行 随访 。 观 察 时 间 较 短 的 试验 , 在 随访 终止 时 
一 次 性 收集 资料 即 可 ; 如 果 观 察 时 间 较 长 , 则 需要 在 整个 观察 期 内 分 几 次 随访 , 其 间隔 以 及 随 
访 次 数 视 具体 研究 的 需要 而 定 。 

1. 随访 观察 的 内 容 、@ 干 预 措施 的 实施 和 标准 化 ; @ 某 些 影响 因素 的 变化 , 如 饮食 、 其 他 
疾病 等 ; @ 有 关 结 局 或 判断 结局 变量 的 各 种 临床 和 实验 资料 。 

2. 随访 观察 的 原则 ”Q@ 对 试验 组 和 对 照 组 要 采用 同等 的 随访 和 资料 收集 方法 ; 四 对 所 有 
研究 对 象 都 要 求 随访 到 观察 终止 期 , 尽量 避免 失 访 或 中 途 退 出 ; @ 对 随访 调查 人 员 应 事先 进行 
统一 培训 、 统 一 资料 收集 的 方法 和 标准 。 

3. 资料 收集 方法 “”@ 随 访 研究 对 象 或 知情 人 ; @ 体 检 或 采样 进行 实验 室 检测 , 例如 测量 血 
压 、 尿 糖 、 血 脂 等 ; @ 到 有 关 单 位 收集 现成 的 资料 , 包括 档案 和 记录 等 , 如 气象 和 环境 监测 资料 、 
医院 的 病案 、 出生、 死亡 登 记 、 工 厂 企业 就 业 和 工种 档案 .工作 日 志 等 ; @ 环 境 调查 , 如 居住 及 环 
况 卫 生 情 况 ,饮用 水 源 、 水 质 如 何 、 工 作 环境 如 何等 。 
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四 、 资 料 的 整理 与 分 析 

(一 ) 均衡 性 检验 

临床 试验 各 比较 组 的 可 比 性 是 评价 研究 结果 的 关键 , 因此 资料 分 析 的 第 一 步 要 进行 各 比较 
组 的 均衡 性 检验 , 评价 各 种 可 能 影响 药物 疗效 、 干 预 措施 效果 的 因素 在 各 比较 组 之 间 是 否 均 衡 ， 
排除 各 种 干扰 因素 对 结果 的 影响 , 从 而 正确 评价 临床 试验 的 结果 。 一 般 是 采用 :检验 和 方差 分 
析 检 验 计量 指标 在 各 组 之 间 差异 的 显著 性 ; 采用 如 检 验 、.w 检验 分 析 计数 指标 在 各 组 之 间 差 异 
的 显著 性 。 只 有 排除 了 干扰 因素 的 影响 ,才能 判断 试验 结果 确 为 干预 措施 所 起 的 作用 。 

(二 ) 统计 描述 和 统计 推断 

就 临床 试验 而 言 , 其 最 终 目的 总 是 比较 两 组 或 多 组 疗效 之 间 的 差异 。 如 果 存 在 差异 , 则 应 
检验 其 差异 有 无 统计 学 意义 , 同时 应 评价 其 临床 意义 。 临 床 意 义 的 评价 应 包括 对 费用 效益 、 费 
用 效果 、 治 疗 副作用 及 治疗 的 复杂 和 方便 程度 等 的 评估 。 无 论 是 治疗 性 还 是 病因 学 的 RCT 研 
究 , 结果 分 析 内 容 主要 为 两 (多 ) 组 计数 指标 的 比较 、 两 (多 ) 组 计量 指标 的 比较 、 相 关 性 分 析 以 
及 多 因素 分 析 等 方面 。 

1. 计数 资料 ”如果 结局 变量 是 痊愈 好 转 、 无 效 、 死 亡 ` 生 存 等 计数 资料 , 则 评价 指标 一 般 
用 率 、 比 等 相对 指标 , 而 不 用 绝对 数 , 如 治愈 多 少 人 等 。 在 两 (多 ) 组 治疗 结果 计数 指标 的 比较 
分 析 中 , 主要 的 指标 包括 治愈 率 、 有 效率 、 不 良 反应 发 生 率 、 病 死 率 、 病 残 率 等 。 组 间 比 较 , 可 采 
用 X 检验 或 Fisher 确切 概率 法 ; 若 选用 等 级 指标 , 如 痊愈 有效 、 好 转 、 无 变化 , 可 以 进行 Ridit 
分 析 ; 如 果 考 虑 多 种 因素 对 结果 的 影响 , 可 以 采用 多 因素 分 析 的 方法 , 如 logistic 回归 分 析 等 ， 
这 样 既 可 得 到 研究 因素 (药物 ) 的 净 效 应 , 也 可 弄 清 有 关 因素 的 影响 大 小 和 方向 。 此 外 , 还 可 以 
计算 有 关联 系 强度 指标 及 其 95% 可 信 区 间 , 如 RR、4R、4R% 等 。 近 年 来 又 陆续 出 现 一 些 反映 
临床 价值 的 系列 指标 , 如 RRR、4RR、NNT、NNH 等 ,也 可 计算 它们 各 自 的 结果 及 95% 可 信和 区 间 
(参见 有 关 统 计 学 书籍 )。 随 机 对 照 试验 中 最 常用 的 率 有 以 下 四 种 : 














(1) 有 效率 
有 效率 =( 治 疗 有 效 例 数 / 治 疗 的 总 例 数 )x 100% 式 (4-3) 
注意 治疗 有 效 例 数 包括 治愈 人 数 和 好 转 人 数 , 治愈 和 好 转 需 有 明确 的 判断 标准 。 
(2) 治愈 率 
治愈 率 =( 治 愈 人 数 / 治 疗 总 人 数 )x 100% 式 (4-4) 
(3 ) 病死 率 
病死 率 =( 因 某 病死 亡 人 数 / 某 病 患者 数 )x 100% 式 (4-5) 
(4)n 年 生存 率 
n 年 生存 率 =( 活 到 nn 年 的 病人 数 / 观 察 满 4 年 的 病人 数 )x100% 式 (4-6) 


生存 率 的 计算 还 有 Kaplan-Meier 法 、 寿 命 表 法 等 , 请 参见 相关 统计 学 书籍 。 

2. 计量 资料 在 结果 为 定量 指标 的 比较 分 析 中 , 主要 指标 为 算术 均 数 、 几 何 均 数 及 中 位 数 
等 。 两 组 间 比 较 , 可 采用 1 检验 ; 若是 多 组 间 比 较 , 则 可 用 方差 分 析 , 如 果 总 体检 验 有 统计 学 
意义 , 还 需要 进一步 做 两 两 比较 。 若 有 多 个 观察 测量 时 点 , 则 应 采用 重复 测量 方差 分 析 。 同 时 
对 于 结局 变量 是 血压 .血脂 血糖、 血红 蛋白 等 计量 指标 , 除了 仍 可 按照 某 些 标准 (如 治愈 、 好 
转 、 无 效 ) 将 其 转换 成 计数 资料 处 理 外 , 可 对 两 组 每 个 对 象 治疗 前 后 观察 指标 值 的 差 (如 血压 下 
降 多 少 ) 的 均 数 进行 比较 。 另 一 种 方法 是 计算 下 降 或 升 高 的 比例 , 如 收缩 压 从 200mmHg 降 至 
140mmHg, 可 表示 为 下 降 60mmHg, 也 可 表示 为 下 降 了 30%。 定 量 资 料 的 分 析 要 考虑 资料 是 否 
满足 正 态 性 和 方差 齐 性 , 若 不 满足 , 改 用 秩 和 检验 ; 当 考虑 某 一 治疗 性 措施 与 结果 的 关系 时 , 可 
做 相关 性 分 析 , 如 判定 不 同 药 量 、 不 同 疗程 不同 年龄 等 因素 与 疗效 间 的 关系 。 同 样 在 结果 为 
定量 指标 的 比较 分 析 中 可 采用 多 因素 分 析 方 法 , 如 多 元 线性 回归 , 获得 研究 因素 及 其 他 因素 对 
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结果 的 贡献 大 小 。 

(三 ) 失 访 的 处 理 

随机 对 照 坛 验 为 前 瞻 性 研究 , 无 论 随访 时 间 长 短 , 失 访 不 可 避免 , 失 访 率 不 同 , 对 研究 结果 
的 影响 也 各 有 不 同 。 建 议 采 用 意向 治疗 分 析 (intention to treat analysis, ITT), 若 只 对 完全 依从 的 
部 分 研究 对 象 进行 分 析 (per protocol, PP), 结果 可 能 高 估 。 


五 .应 用 范围 


(一 ) 临床 治疗 或 预防 性 研究 

随机 对 照 试验 最 常用 于 治疗 性 或 预防 性 研究 , 借以 探讨 药物 、 治 疗 方案 、 筛 查 方法 等 干预 
或 预防 措施 的 确切 疗效 , 同时 评价 不 良 反应 , 排除 非 治疗 和 干预 因素 造成 的 毒 副 反应 ,为 正确 
的 医疗 决策 提供 科学 依据 。 

随机 对 照 试 验 虽 被 公认 为 是 最 佳 的 治疗 性 研究 设计 方案 , 但 并 不 能 用 于 研究 和 解决 所 有 的 
临床 问题 。 在 某 些 情况 下 , 使 用 随机 对 照 试 验 是 不 可 行 或 不 恰当 的 , 如 诊断 性 研究 、 疾 病 预 后 
研究 等 。 

(二 ) 特定 的 病因 学 研究 

多 数 情况 下 , 随机 对 照 试验 并 不 适用 于 病因 学 研究 , 将 某 种 致 病因 素 和 危险 因素 直接 施加 
于 人 体 , 进行 致 病 效应 的 研究 是 不 符合 医德 的 。 例 如 , 要 了 解吸 烟 在 肺癌 发 病 中 的 作用 , 人 为 
设计 一 个 随机 对 照 试验 , 将 原本 不 吸烟 的 研究 对 象 随 机 分 配 入 吸烟 组 或 不 吸烟 组 , 随访 数 年 ， 
比较 两 组 肺癌 的 发 生 率 , 显然 既 缺 乏 可 操作 性 , 也 有 违 医德 。 但 在 特定 的 条 件 下 , 随机 对 照 试 
验 也 可 以 用 于 病因 学 因果 效应 研究 。 应 用 的 前 提 是 : 尚 无 充分 证 据 证 明 某 种 可 能 致 病因 素 对 人 
体 有 危害 , 但 又 不 能 排除 它 与 疾病 的 发 生 有 关 。 若 已 有 研究 证 明 某 一 因素 对 人 体 有 害 , 就 不 多 
许 将 该 因素 用 于 人 体 进 行 随 机 对 照 试 验 。 

例如 , 妇 产 科 为 预防 早产 儿 因 缺 氧 带 来 的 大 脑 损害 和 对 今后 智力 发 育 不 全 的 影响 , 曾 对 早 
产 婴 儿 常 规 应 用 高 浓度 的 氧气 疗法 。 后 来 发 现 经 此 治疗 的 婴儿 , 出 现 了 眼 晶 状 体 后 纤维 组 织 增 
生 , 导致 不 同 程度 的 视力 障碍 , 严重 者 甚至 失明 。 经 分 析 推论 , 认为 可 能 与 高 浓度 氧 疗 有 关 , 为 
证 实 这 种 因果 效应 , 于 是 采用 了 随机 对 照 试验 , 一 组 早产 儿 继续 用 高 浓度 氧 疗 , 另 一 组 则 用 低 
浓度 氧 疗 。 经 追踪 观察 分 析 , 上 述 视力 障碍 确 与 高 浓度 氧 疗 有 关 , 于 是 , 临床 上 就 淘汰 了 这 一 
疗法 。 后 来 ， 这 一 病征 被 命名 为 “Terry’s syndrome”( 早 产儿 视网膜 病变 )。 

(三 ) 非 临 床 试验 的 系统 工程 

随机 对 照 试验 还 可 应 用 于 非 临床 试验 的 系统 工程 , 如 教育 学 和 农业 等 领域 。 例 如 , 要 评价 
循 证 医学 教育 模式 与 传统 医学 教育 模式 的 教学 效果 , 可 将 条 件 相似 的 学 生 随 机 分 配 进入 任何 一 
组 , 课程 结束 后 进行 短期 或 长 期 效果 的 评估 。 


六 、 优 缺 点 



































(一 ) 优点 

1. 前 瞻 性 的 对 照 设 计 “可 以 人 为 控制 研究 对 象 的 条 件 和 暴露 情况 ,对 结果 进行 标准 化 评价 ; 
由 于 试验 组 和 对 照 组 是 同步 前 脆性 的 观察 , 故 外 部 因素 对 结果 影响 较 小 , 可 以 验证 因果 关系 。 

2. 可 比 性 好 ”通过 随机 分 组 ,将 研究 对 象 随机 分 配 , 特别 是 在 某 些 情况 下 , 将 研究 对 象 按 
影响 结果 的 某 些 重要 因素 进行 先 分 层 、 后 随机 , 进入 试验 组 和 对 照 组 , 使 各 比较 组 的 组 间 基 线 
状况 保持 相对 一 致 , 可 增加 可 比 性 。 

3. 控制 偏 倚 ” 采 用 随机 分 配 和 分 配方 案 的 完善 隐藏 , 在 选择 和 分 配 研究 对 象 时 可 以 较 好 
地 防止 人 为 因素 的 影响 , 即使 存在 不 为 人 知 的 干扰 因素 , 也 可 维持 在 各 比较 组 间 的 相对 平衡 ， 
有 效 地 控制 了 选择 偏 倚 和 信息 偏 倚 。 采 取 盲 法 评价 疗效 , 避免 了 研究 对 象 和 疗效 观察 者 的 主观 
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因素 所 致 的 非特 异性 疗效 和 测量 误差 , 可 有 效 控制 信息 偏 倚 。 

4. 诊断 和 实施 标准 化 ”对 研究 对 象 ,采用 严格 一 致 的 诊断 /纳入 和 排除 标准 , 有 利于 读者 
验证 研究 结果 和 确定 研究 结果 的 推广 应 用 价值 。 同 时 实施 过 程 采 用 明确 的 标准 化 的 方法 , 能 有 
效 地 控制 各 种 干扰 因素 , 使 结果 更 趋 真实 。 

5. 资料 统计 分 析 效 能 高 ”由 于 大 多 数 统计 方法 是 建立 在 随机 抽样 的 基础 上 , 因此 随机 对 
照 试验 更 为 适合 ,采用 单 因素 和 多 因素 的 统计 分 析 方 法 , 能 获得 高 质量 的 结果 。 

(二 ) 缺点 

1. 成 本 高 ”由 于 随机 对 照 试验 需要 严格 的 设计 , 实施 条 件 限制 多 , 因此 比较 耗费 时 间 , 人 
力 与 财力 支付 较 大 。 

2. 外 部 真实 性 受 限 “随机 对 照 试验 常 因 纳入 /排除 标准 过 于 严格 , 虽 使 人 选 对 象 具有 良好 
的 同 质 性 ,但 同时 也 导致 其 研究 结果 的 代表 性 和 外 部 真实 性 受 限 。 

3. 医学 伦理 问题 “在 随机 对 照 试验 当中 , 如 果 不 恰 当地 应 用 安慰 剂 、 选 用 的 对 照 组 措施 不 
当 , 或 者 让 研究 对 象 暴露 于 某 种 有 害 致 病危 险 因素 , 或 者 研究 对 象 不 知情 同意 , 都 会 出 现 医学 
伦理 问题 。 

( 黄 悦 勤 ) 


二 节 ”随机 对 照 试验 的 一 些 特例 


一 .交叉 试验 
(一 ) 概述 
交叉 试验 (cross-over design ) 是 指 试验 中 的 试验 组 和 对 照 组 在 整个 试验 过 程 中 通过 前 后 两 个 
阶段 互相 交叉 的 方式 完成 , 即 分 别 先后 接受 两 种 不 同 试验 措施 的 处 理 , 最 后 评价 试验 结果 的 一 
种 临床 试验 性 研究 。 主 要 用 于 临床 干预 措施 的 研究 和 评价 , 是 随机 对 照 试验 的 一 种 特殊 类 型 。 
它 兼 有 随机 对 照 试验 和 自身 前 后 对 照 试验 的 优点 , 属于 一 级 设计 方案 。 
在 试验 开始 前 , 符合 纳入 标准 的 试验 对 象 先进 入 观察 期 , 了解 研究 对 象 是 否 处 于 一 个 相对 








稳定 的 状态 , 例如 在 比较 和 评价 新 的 治疗 高 血压 的 方案 中 , 观察 期 的 研究 对 象 的 血压 已 达 正常 


水 平 , 则 不 宜 列 入 研究 对 象 , 以 免 影响 研究 结果 的 判断 。 经 过 一 定时 间 观 察 后 , 将 符合 纳入 标 
准 的 研究 对 象 通 过 随机 的 方法 分 为 试验 组 和 对 照 组 , 分别 接受 第 一 阶段 试验 , 如 试验 组 首先 接 
受 方案 A, 而 对 照 组 接受 方案 B, 经 过 一 定时 间 试验 观测 , 并 获得 相应 的 结果 之 后 , 按 设计 要 求 
经 过 洗 脱 期 (washout period ) 然 后 进入 第 二 阶段 的 交叉 试验 。 即 两 组 进行 交换 , 试验 组 换 为 方案 
B, 而 对 照 组 换 为 方案 A。 按照 第 一 阶段 相同 的 指标 , 观测 第 二 阶段 的 治疗 反应 。 当 试验 结束 
时 ,将 其 结果 与 第 一 阶段 的 结果 进行 综合 分 析 和 评价 。 

在 交叉 试验 设计 时 ,一 定 要 注意 前 后 两 个 试验 阶段 药物 消 洗 期 的 时 间 设 置 , 通常 以 药物 的 
5 个 半衰期 为 宜 ,不宜 过 短 或 过 长 ,否则 易 受 偏 倚 干 杭 的 影响 。 

(二 ) 应 用 范围 

一 般 而 言 , 交叉 试验 仅 适用 于 慢性 病 目 不 易 根 治 并 需要 药物 维持 治疗 的 某 些 疾病 的 研究 。 
如 高 血压 病 、 冠 心病 心绞痛 支气管 哮喘 等 。 因 为 这 些 疾病 通常 不 用 药物 治疗 就 会 发 作 。 因 此 
对 于 某 些 一 治 即 愈 者 是 不 能 采用 交叉 试验 设计 方案 的 。 此 外 , 在 新 药 的 开发 和 研究 中 , 为 减少 
样本 含量 的 需要 , 了 期 临床 试验 常 采用 交叉 试验 来 观察 药物 的 毒 副 反应 , 以 便 减 少 或 消除 个 体 
间 偏 倚 的 影响 。 

(三 ) 设计 模式 及 特点 

交叉 试验 通过 随机 的 方法 将 受 试 者 分 成 两 组 , 甲 组 先 接受 方案 A, 乙 组 接受 方案 B, 两 组 同 
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时 进行 观察 。 经 过 一 定 消 洗 期 后 , 甲乙 两 组 再 交换 接受 方案 B 和 方案 A。 将 两 个 不 同 阶 段 观察 
到 的 结果 进行 综合 比较 分 析 (图 4-2)。 





第 一 阶段 第 二 阶段 
停 药 洗 脱 。 B 组 
用 药 用 药 一 一 一 一 > 
< > 总 结 
B 组 A 组 
安慰 剂 安慰 剂 
观察 比较 疗效 观察 比较 疗效 


图 4-2 交叉 试验 设计 模式 图 


《四 ) 结果 分 析 

交叉 试验 中 每 个 受 试 对 象 都 要 接受 两 种 措施 的 处 理 , 必然 得 到 两 种 方案 的 观察 结果 。 由 于 
系 自身 前 后 对 照 , 对 定性 资料 应 采用 配对 ?检验 (McNemar 检验 ), 而 定量 资料 则 采用 配对 ! 检 
验 和 符号 秩 和 检验 。 根 据 前 后 两 方案 的 处 理 , 将 观察 的 结果 分 别 列 人 配对 四 格 表 ( 表 4-3), 即 
方案 A 和 B 均 有 效 的 为 a, 均 无 效 的 为 d, 方案 A 有 效 而 B 无 效 的 为 5, 而 方案 A 无效 而 B 有 效 
则 为 c。 


表 4-3 ”交叉 试验 结果 分 析 四 格 表 

















方案 B 汪 
方案 A 有 区 有 合计 
有 效 a b atb 
无 效 < 4 人 
合计 a+C b+d N 
(五 ) 优 缺 点 
1. 优点 
(1) 具有 随机 对 照 试 验 的 优点 : 交叉 试验 作为 随机 对 照 试验 的 特例 , 采用 随机 分 组 、 讶 法 测 


量 和 同期 对 照 的 方法 ,具有 随机 对 照 试 验 的 全 部 优点 ,有 效 控制 了 选择 性 偏 倚 、 信 息 偏 倚 和 混 
杂 偏 倚 , 试验 结果 真实 可 靠 。 

(2) 设计 特点 : 每 个 受 试 对 象 先后 接受 两 种 方案 处 理 , 具有 自身 前 后 比较 的 特点 , 消除 了 个 
体 差 异 , 同时 也 获得 组 间 比 较 的 结果 , 可 大 大 减少 样本 量 。 

2. 缺点 

(1) 应 用 范围 受到 限制 , 只 适用 于 慢性 、 复 发 性 疾病 。 

(2) 试验 过 程 包括 一 定 洗 脱 期 , 如 过 短 则 难以 避免 两 种 措施 的 沾染 和 干扰 ,过 长 影响 试验 周 
期 ,其 至 使 患者 长 时 间 得 不 到 应 有 的 治疗 ,影响 预后 。 

(3) 如 果 试 验 周期 长 , 容易 发 生 失 访 、 退 出 、 依 从 性 下 降 等 问题 。 

(4) 每 个 病例 在 接受 第 二 阶段 治疗 时 , 很 难保 证 病情 处 于 试验 第 一 阶段 开始 时 的 相似 状态 ， 
降低 第 二 阶段 的 可 比 性 , 也 影响 疗效 评估 


二 、 自 身 前 后 对 照 试 验 


(一 ) 概述 

自身 前 后 对 照 试验 (before-after study in the same patient) 指 每 一 个 受 试 对 象 ， 先后 接受 试验 
和 对 照 两 种 不 同 措施 进行 试验 研究 , 最 后 将 两 次 先后 观测 的 结果 进行 比较 的 一 种 设计 方案 。 自 
身 前 后 对 照 试验 是 以 个 体 自身 为 对 照 , 它 可 以 避免 个 体 差异 对 结果 的 影响 。 在 研究 过 程 中 , 试 
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验 和 对 照 两 种 措施 的 先后 安排 可 以 是 随机 的 , 也 可 以 是 非 随机 的 , 最 好 采用 随机 方法 选择 试验 
措施 或 对 照 措 施 作为 第 一 阶段 的 试验 。 如 方案 A 随机 地 进入 第 一 阶段 研究 , 受 试 者 先 接受 方案 
A 的 干预 , 当 完成 试验 观测 任务 后 , 则 停止 用 药 并 总 结 前 阶段 的 试验 结果 。 然 后 进入 消 洗 期 , 消 
洗 期 ( 洗 脱 期 ) 结 束 后 , 更 换 为 方案 B 开始 第 二 阶段 的 试验 研究 。 同 样 按 照 第 一 阶段 方案 A 的 测 
试 指标 观测 相应 的 结果 , 完成 后 则 将 前 -后 两 阶段 的 结果 进行 分 析 和 比较 。 

(二 ) 应 用 范围 

自身 前 后 对 照 设计 ,每 例 受 试 者 均 要 在 前 - 后 不 同 阶段 接受 试验 和 对 照 两 种 措施 , 因此 和 
交叉 试验 一 样 仅 适用 于 慢性 反复 发 作 疾 病 的 防治 性 研究 。 

(三 ) 设计 模式 及 特点 

自身 前 后 对 照 试验 属于 前 脆性 研究 设计 , 符合 研究 的 纳入 对 象 随机 或 非 随机 的 在 第 一 阶段 
接受 一 种 措施 的 试验 , 然后 经 过 一 定 的 洗 脱 期 后 , 受 试 者 开始 接受 第 二 阶段 的 第 二 种 措施 。 当 
完成 试验 后 , 将 前 - 后 的 试验 结果 进行 分 析 比较 (图 4-3)。 


HH 











N > Ne E, 

; 
被 三 第 治 结 洗 第 治 
和 
的 例 措 间 中 措 间 
学 施 施 


图 4-3 自身 前 后 对 照 研究 设计 模式 
N: 符合 公认 的 诊断 标准 的 病人 总 数 或 人 群 总 数 。 Ne: 该 人 群 或 病人 中 符合 纳入 标准 又 不 具备 排除 
E: 未 暴露 可 疑 致 病因 素 或 未 接受 防治 措施 的 对 标准 的 人 数 

















照 组 E: 暴露 可 疑 致 病因 素 或 接受 防治 措施 的 试验 组 
D: 发 病人 数 , 有 效 人 数 , 生存 数 等 了 上 -: 为 随访 期 或 观察 期 , 中 间 填 时 间 


五 : 未 发 病人 数 , 无 效 人 数 , 死亡 数 等 
(四 ) 结果 分 析 
参与 自身 前 后 对 照 试验 的 患者 必须 完成 两 个 阶段 的 研究 才能 纳入 结果 分 析 , 因此 每 例 均 有 
前 后 两 种 措施 处 理 后 的 观察 结果 。 受 试 对 象 可 能 有 四 种 情况 ( 表 4-4), a 为 两 种 方案 均 有 效 ,2 
为 方案 1 无 效 而 方案 2 有 效 ,c 为 方案 1 有效 而 方案 2 无 效 , 4 为 两 种 方案 均 无 效 。 自 身 前 后 对 
照 研究 的 结果 属于 配对 资料 , 故 定量 资料 采用 配对 ;检验 ; 而 定性 资料 采用 配对 x? 检验。 


表 4-4 自身 前 后 对 照 研究 结果 分 析 四 格 表 














第 二 种 措施 二 第 一 种 措施 志 
有 效 a b 
无 效 
(五 ) 优 缺 点 
1. 优点 
(1) 受 试 者 以 自身 为 对 照 , 可 消除 个 体 差异 , 减少 样本 量 , 节约 时 间 和 成 本 。 


(2) 每 例 受 试 者 均 有 接受 试验 和 对 照 两 种 措施 的 机 会 , 具有 公平 性 。 
(3) 减 少 了 自愿 者 偏 做 和 研究 人 员 意 愿 偏 倚 。 
(4) 可 以 实现 试验 措施 的 标准 化 。 


\ 
j 


第 四 章 ”临床 研究 的 常用 设计 方案 


(5) 试验 中 采用 盲 法 并 用 随机 方法 安排 前 后 干预 措施 , 提高 了 结果 可 信 度 。 
2. 缺点 
(1) 自身 前 后 对 照 试验 分 前 后 两 个 阶段 , 难以 保证 两 阶段 的 起 始点 完全 一 致 , 可 能 影响 两 个 
阶段 的 可 比 性 。 
(2) 试验 的 应 用 范围 有 限 , 只 适用 于 慢性 、 复 发 且 不 能 自 限 自 愈 的 疾病 。 
〈3 ) 洗 脱 期 过 长 可 能 影响 患者 的 及 时 治疗 。 
( 黄 悦 勤 ) 


第 三 节 ”其 他 类 型 的 对 照 试验 


一 、 半 随机 对 照 试验 
半 随 机 对 照 试 验 (quasi-randomized controlled trial ) 与 随机 对 照 试验 设计 相似 ， 唯一 的 区 别 是 
试验 对 象 分 配方 式 不同 。 它 是 按 半 随 机 分 配方 式 , 即 按 研究 对 象 的 生日 、 住 院 日 或 住院 号 等 末 
位 数字 的 奇偶 数 , 将 试验 对 象 分 配 到 试验 组 或 对 照 组 , 接受 不 同 干预 措施 。 
半 随 机 对 照 试验 常 因 分 配方 式 , 容易 出 现 选择 偏 倚 , 造成 基线 情况 的 不 平衡 , 因此 , 虽然 花 
费 的 时 间 、 精 力 、 财 力 并 不 亚 于 随机 对 照 试验 , 但 其 结果 的 真实 可 靠 性 却 不 及 随机 对 照 试验 。 


二 、 非 等 量 随机 对 照 试验 

非 等 量 随机 对 照 试 验 (unequal randomized controlled trial) 指 试验 对 象 按 一 定 比例 (通常 为 2:1 
或 3:2) 随 机 分 配 和 人 试验 组 或 对 照 组 。 主 要 应 用 于 新 药 疗 效 验 证 研究 , 特别 是 由 于 病人 来 源 和 
研究 经 费 有 限 而 研究 者 希望 尽快 获得 结果 的 情况 。 但 需要 注意 的 是 试验 组 和 对 照 组 的 例 数 不 
能 相差 过 大 , 否则 会 降低 检验 效能 ,超出 1:4 或 4:1 比例 ,检验 效能 会 明显 下 降 。 

三 、 整 群 随机 对 照 试验 

整 群 随机 对 照 试 验 (Cluster randomized controlled trial ) 不 同 于 多 数 随机 对 照 试 验 以 患者 个 体 
为 随机 分 配 单位 , 而 是 在 某 些 特殊 情况 下 , 以 多 个 个 体 组 成 的 小 群体 作为 分 配 单位 , 进行 随机 
分 组 。 

例如 ,设计 一 种 预防 心血 管 病 的 特殊 腾 食 食谱 , 拟 与 普通 饮食 比较 , 观察 预防 心血 管 疾病 
发 生 的 效果 。 假 若 一 家 4 口 人 中 , 有 3 个 被 选 为 合格 的 试验 对 象 , 其 中 有 可 能 1 人 分 配 到 特殊 
膳食 组 , 2 人 分 配 到 普通 饮食 组 。 在 日 常生 活 中 , 一 家 人 不 可 能 长 期 做 两 种 不 同 膳食 供用 , 即 
使 做 到 了 , 沾染 或 干扰 现象 也 不 可 避免, 从 而 影响 研究 结果 。 显 然 单个 体 不 宜 作为 试验 的 分 配 
单位 。 于 是 ,就 可 以 一 个 家 庭 , 一 对 夫妇 , 一 个 小 组 甚至 一 个 乡镇 等 作为 随机 分 配 单位 ,将 其 
随机 地 分 配 入 试验 组 或 对 照 组 , 分 别 接受 相应 的 措施 , 进行 研究 。 此 类 试验 称 为 整 群 随机 对 照 
试验 。 

整 群 随机 对 照 试 验 在 设计 上 与 一 般 随 机 对 照 试 验 一 样 , 不 同 之 处 在 于 因 随 机 分 配 的 单位 不 
同 , 导致 样本 含量 和 结果 分 析 方法 有 所 差异 , 所 需 样本 含量 较 大 。 

四 、 基 于 单个 患者 的 随机 对 照 试验 

单个 患者 的 随机 对 照 试验 (number of one randomized controlled trial, n-of-1 trial ) 是 基于 起 患 
慢性 疾病 的 单个 个 体 , 进行 的 一 种 随机 对 照 试 验 , 以 确定 多 种 治疗 措施 中 哪 一 种 对 该 患者 有 效 ， 
从 而 避免 服用 多 种 药物 ,减少 浪费 以 及 避免 误 服 某 些 无 效 其 至 有 害 药物 。 

方法 是 将 所 有 “有 效 ” 的 药物 与 其 安慰 剂 配对 , 以 每 对 药物 为 一 个 单位 , 采用 随机 分 配 的 方 
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式 决 定 每 对 药物 的 使 用 顺序 ; 对 每 对 药物 , 同样 以 随机 分 配 的 方式 决定 试验 药物 和 安慰 剂 的 使 
用 顺序 。 依 药物 疗效 发 生 和 达到 稳定 所 需 的 时 间 来 决定 药物 的 观察 期 , 所 有 试验 药物 的 观察 期 
应 保持 一 致 , 以 便 比 较 。 通 常 采 用 双 盲 法 , 以 利于 试验 结果 的 评价 。 基 于 单个 患者 的 随机 对 照 
试验 适用 于 慢性 复发 性 疾病 。 
五 、 非 随机 同期 对 照 试验 
非 随机 同期 对 照 试 验 (concurrent nonrandomized controlled trial ) 是 临床 传统 使 用 的 一 种 研究 


设计 , 指 试验 组 和 对 照 组 的 受 试 对 象 不 是 随机 分 配 的 , 而 是 由 病人 或 医生 根据 病情 及 有 关 因 素 
人 为 地 分 到 试验 组 或 对 照 组 , 并 同期 进行 结果 观察 。 


非 随机 对 照 试验 是 前 瞻 性 的 研究 。 常 用 于 比较 临床 不 同 干预 措施 的 实际 效果 。 该 试验 在 
研究 对 象 的 分 组 分 配 上 , 由 于 人 为 的 因素 , 往往 会 造成 试验 和 对 照 两 组 之 间 在 试验 前 即 处 于 不 
同 的 基线 状态 ,缺乏 可 比 性 。 在 研究 过 程 中 也 难以 讶 法 评价 试验 结果 , 使 得 许多 已 知 /未 知 的 
偏 倚 影 响 观 测 结果 的 真实 性 。 但 在 临床 实际 工作 中 , 有 些 情况 下 不 适宜 做 随机 对 照 试验 , 例如 
外 科 手 术 治疗 、 急 重症 病人 抢救 或 贵重 药物 的 选用 等 。 因 此 , 只 能 根据 具体 情况 将 患者 分 人 试 
验 组 或 对 照 组 。 其 研究 结果 的 论证 强度 虽 远 不 及 随机 对 照 试验 , 但 在 尚 无 随机 对 照 试验 结果 或 
不 能 进行 随机 对 照 试验 时 , 还 是 可 取 的 , 尤其 是 对 于 大 样本 的 非 随机 同期 对 照 试验 结果 , 仍 具 
有 重要 的 临床 价值 。 只 不 过 在 分 析 和 评价 研究 结果 的 价值 及 意义 时 , 应 持 审慎 的 科学 态度 。 该 
研究 方案 的 可 行 性 好 , 易 为 临床 医生 和 患者 接受 , 依从 性 较 好 ; 但 由 于 选择 性 偏 倚 和 测量 性 偏 
倚 的 影响 , 降低 了 结果 的 真实 性 , 其 论证 强度 也 相应 减弱 。 


六 、 多 中 心 临床 试验 











(一 ) 设计 原则 
多 中 心 临床 试验 (multicenter clinical trial ) 是 由 多 位 研究 者 按 同 一 试验 方案 在 不 同 地 点 和 单 





位 同时 进行 的 临床 试验 ; 各 中 心 同 期 开始 与 结束 试验 ; 多 中 心 试验 由 一 位 主要 研究 者 总 负责 ， 





并 作为 临床 试验 各 中 心间 的 协调 者 。 大 型 多 中 心 合作 临床 试验 一 般 均 有 1000 例 以 上 大 样本 。 

大 型 多 中 心 合作 的 临床 研究 常 有 以 下 两 种 : 一 种 是 大 样本 随机 临床 试验 , 一 种 是 亚 期 新 药 
临床 试验 。 两 者 均 是 为 了 评估 某 种 治疗 措施 的 临床 效果 , 但 也 有 不 同 之 处 。 大 样本 随机 临床 斌 
验 是 医疗 科研 人 员 发 起 的 、 旨 在 解决 医学 领域 某 些 尚 待 解决 的 问题 进行 的 临床 研究 , 用 以 评估 
某 种 治疗 措施 对 患者 生存 率 及 重要 临床 事件 的 影响 ; 而 亚 期 新 药 临床 试验 是 药品 生产 三 家 按照 
药品 法 规定 , 为 达到 新 药 注册 的 目的 所 进行 的 试验 研究 , 旨 在 评估 该 药 的 临床 疗效 及 不 良 反应 。 

进行 大 型 多 中 心 合作 临床 试验 , 从 社会 效益 方面 看 , 因 其 设计 方法 科学 , 可 公正 地 评估 治 
疗 药物 的 疗效 , 限制 或 淘汰 疗效 差 或 有 严重 不 良 反应 药物 , 能 为 循 证 医学 实践 提供 证 据 , 有 助 
于 提高 临床 治疗 水 平 ; 从 经 济 效益 方面 看 , 进行 大 型 多 中 心 合作 临床 试验 , 既 可 为 国家 和 患者 
节省 大 量 医药 开支 , 又 可 让 安全 有 效 药 的 生产 厂家 获 益 , 从 而 实现 双赢 。 此 外 , 大 型 多 中 心 临 
床 试验 也 是 上 市 后 药物 疗效 再 评价 的 最 佳 方法 。 

(二 ) 实施 方法 

1. 统一 方案 多 中 心 合作 临床 试验 的 设计 和 实施 必须 考虑 到 多 中 心 的 特点 , 研究 方案 要 
由 各 参与 方 的 主要 研究 者 共同 讨论 以 后 确定 , 然后 以 书面 方式 予以 确认 。 

2. 医学 伦理 ”研究 方案 及 其 附件 要 由 伦理 委员 会 讨论 通过 并 做 出 书面 同意 后 方 能 执行 。 
多 中 心 合作 临床 试验 涉及 一 个 以 上 研究 机 构 的 伦理 委员 会 。 

3. 统一 培训 ”多 中 心 合作 试验 同时 涉及 多 个 研究 机 构 , 而 每 一 个 研究 机 构 , 除 主要 研究 者 
外 ,还 有 诸多 研究 参与 者 。 为 使 他 们 能 够 按 同一 标准 来 执行 研究 方案 中 的 每 一 个 具体 细节 , 需 
要 对 研究 参与 者 进行 规范 化 培训 , 该 临床 试验 的 所 有 参与 人 员 , 如 医师 .护士 .药师 、 检 验 人 员 ， 
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均 应 进行 培训 。 

4. 研究 的 同步 性 ”多 中 心 合作 临床 试验 要 在 各 研究 机 构 同 步 进行 , 因此 应 规定 各 个 研究 
机 构 中 首 例 受 试 者 入 组 时 间 和 最 后 一 名 受 试 者 入 组 及 完成 时 间 。 这 可 使 临床 试验 统一 在 规定 
时 间 内 完成 , 不 同 中 心 完 成 时 间 若 祖 差 过 大 , 可 能 会 导致 中 心 效应 。 

5. 评价 “多 中 心 合作 临床 试验 中 应 采用 统一 的 安全 性 和 疗效 评价 方法 ,包括 实验 室 检查 
和 和 临床 检查 方法 ,如 从 身 、 尿 常规 ,到 血 生化 、 有 夺 肾 功能 检测 , 万 至 X 线 \ 心 志 图 以 及 特殊 的 形 
态 和 功能 检查 等 :可 可 室 采 用 不 同 的 材料 和 方法 , 其 检测 结果 就 难以 比 
较 。 为 此 ， 办 给 室 的 办 法 , 即 为 多 中 心 合作 临床 试验 而 专门 建 
立 的 实验 室 , 其 各 项 检查 均 采用 国际 公认 方法 , 所 用 试剂 质量 可 靠 , 操作 规程 透明 、 质 量 控制 明 
确 , 同时 权威 机 构 应 定期 进行 质量 稽查 。 此 外 , 还 应 建立 一 套 标 本 的 采集 、 转 运 、 储 藏 体系 , 将 
各 中 心 的 标本 集中 到 中 心 实验 室 进行 检验 , 统一 出 检验 报告 。 

6. 数据 管理 ”各 中 心 在 试验 时 产生 的 大 量 数据 , 应 传送 到 一 个 数据 处 理 中 心 进行 统一 管 
理 , 包括 查询 、 核 对 、 储 存 , 最 后 进行 分 析 。 

7. 监督 在 多 中 心 合作 临床 试验 中 , 要 配备 专职 的 监察 员 。 监 察 员 的 职责 是 负责 试验 研 
究 的 质量 监控 , 旨 在 保证 各 中 心 严格 按 方案 执行 , 并 对 严重 违背 方案 者 及 时 上 报 。 因 此 , 监察 
员 首先 应 经 过 严格 的 《药品 临床 试验 管理 规范 》( Good Clinical Praetice, GCP) 培 训 , 熟悉 相关 法 
规 , 具有 一 定 的 临床 试验 经 历 或 经 验 。 同时 要 求 掌 握 相 关 专业 临床 知识 具有 识别 原始 资料 和 
证 据 的 能 力 , 另外 监察 员 还 应 熟悉 本 项 目的 研究 方案 及 相关 文件 , 工作 认真 负责 , 有 足够 精力 
进行 定期 的 监察 工作 等 。 监 察 过 程 分 为 三 个 阶段 , 即 监 察 前 、 监 察 中 和 监察 后 。 监 察 内 容 具体 
包括 协作 医院 的 科研 能 力 及 研究 者 对 武 验方 案 的 掌握 , 中 心 随机 化 系统 的 使 用 情况 , 研究 者 对 
方案 的 执行 情况 , 药品 的 储存 .供应 与 回收 , 各 研究 单位 向 项 目 办 公 室 的 资料 传真 情况 , 对 试验 
数据 真实 性 的 考察 . 主要 观察 指标 的 记录 情况 , 以 及 了 解 研究 者 对 该 项 试验 的 意见 等 。 

8. 管理 规范 ”大 型 多 中 心 合作 临床 试验 的 实施 必须 有 一 套 合理 的 科学 管理 规范 , 涉及 临 
床 试 验 设计 方案 及 三 大 康 则 强化 .人员 培 训 、 组 织 机 构 构建 , 以 及 药品 管理 .医学 伦理 、 资 料 管 
亚 、 定 期 监测 、 终 点 事件 评估 、 质 量 控制 ,监察 员 职 责 乃 至 资料 统计 分 析 和 总 结 报告 等 诸多 环节 
或 内 容 , 均 需要 加 以 规范 。 

9. 科研 经 费 预算 “预算 管理 同样 需要 统筹 规划 、 细 心 组 织 。 科 学 、 规 范 地 编制 综合 预算 ， 
是 预算 管理 制度 改革 的 一 项 重要 内 容 。 预 算 编 制 要 紧 紧 围绕 资金 收 支 两 条 线 , 每 一 收 支 项 目 金 
额 应 有 充分 翔实 的 依据 说 明 , 项 目 计算 应 细致 认真 , 不 能 随意 编造 。 确 保 预算 能 够 顺利 届 彻 执 
行 ,同时 执行 中 应 做 到 有 效 控制 .信息 及 时 反馈 ,实施 严格 监督 和 考核 制度 。 

课题 研究 经 费 指 的 是 一 旦 课题 确立 后 ,课题 研究 过 程 中 所 产生 的 支出 费用 , 包括 与 课题 例 
究 有 关 的 所 有 直接 费用 、 间 接 费 用 和 协作 研究 费用 。 

10. 资料 管理 和 分 析 ”大 型 多 中 心 合作 临床 试验 要 求 按照 研究 方案 对 数据 进行 统一 管理 ， 
包括 数据 录入 、 数 据 核查 、 数 据 储存 以 及 数据 分 析 。 对 于 多 中 心 试验 的 数据 管理 , 应 有 专门 负 
责 人 , 其 职责 是 全 程 参与 研究 方案 、 病 例 记录 表 (CRF ) 的 设计 , 提出 统计 分 析 要 求 , 定期 访问 各 
试验 分 中 心 , 监控 数据 收集 质量 。 统 计 分 析 人 员 也 应 全 程 参与 研究 方案 设计 , 负责 制订 统计 分 
析 计 划 和 撰写 统计 分 析 报告 ,同时 还 要 参与 撰写 试验 报告 和 论文 等 。 

(三 ) 项 目 管理 

1. 基本 概念 ”项 目 是 指 一 次 性 、 多 任务 的 工作 , 明确 规定 了 项 目 开始 和 结束 日 期 、 特 定 的 
工作 范围 .预算 和 拟 达 到 的 特定 性 能 水 平等 。 项 目 管理 是 指 : 在 项 目 活动 中 通过 运用 专业 知识 、 
技能 、 工 具 和 方法 ,使 项 目 能 够 实现 或 超过 项 目 干系 人 的 需要 和 期 望 。 这 一 定义 不 仅 强调 使 用 
专门 知识 和 技能 , 还 强调 项 目 管理 中 各 参与 人 的 重要 性 。 因 此 , 项 目 管理 就 是 为 实现 目标 而 在 
项 目 执行 过 程 中 进行 计划 安排 进度 、 控 制 ,沟通 和 激励 , 旨 在 取得 良好 效益 的 各 项 活动 统称 。 
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项 目 管理 包括 启动 、 计 划 、 执 行 、 控 制 、 收 尾 五 大 环节 。 

大 型 多 中 心 合作 临床 试验 作为 一 种 医学 研究 项 目 , 同样 需要 遵循 项 目 管理 的 一 般 原则 。 在 
多 中 心 合作 临床 试验 中 需要 进行 质量 管理 的 包括 中 央 实验 室 (centralized laboratory )、 数 据 获取 
和 报告 (data acquisition and reporting ) (远程 ) 数 据 输 入 [ (remote )data entry ]\ 病例 记录 表 系 统 
(case report form systems )、 临床 数据 管理 (clinical data management)、 不 良 事 件 报告 (adverse event 
reporting) 临床 供给 系统 (clinical supply systems)、 统 计 分 析 系 统 (statistical analysis systems ) 等 ， 
均 涉 及 专门 的 知识 和 技能 。 

同时 , 多 中 心 临床 试验 要 求 各 参与 方 分工 协 作 、 共 同 完成 。 参 与 人 员 包 括 临床 研究 人 员 、 
统计 专业 人 员 、 计 算 机 程序 分 析 员 ( 编 程 人 员 )、 数 据 输 入 录 码 人 员 等。 试验 过 程 中 强调 各 参与 
人 的 重要 性 , 符合 项 目 管理 的 范畴 。 

2. 项 目 管理 内 容 

(1) 项 目 范围 管理 : 是 用 以 保证 项 目 包含 且 只 包含 所 有 需要 完成 的 工作 , 以 便 顺 利 完成 项 目 





所 需要 的 各 个 过 程 , 由 范围 计划 、 范 围 定义 、 范 围 核实 和 范围 变更 控制 等 构成 。 


(2) 项 目 时 间 管理 : 是 用 以 保证 能 够 按时 完成 项 目 所 需 的 各 个 过 程 , 由 活动 定义 、 活 动 排序 、 
活动 历时 估算 、 进 度 计划 编制 和 进度 计划 控制 等 构成 。 

(3) 项 目 成 本 管理 : 是 用 以 保证 在 批准 预算 内 完成 项 目 所 需要 的 各 个 过 程 , 由 资源 计划 、 成 
本 估算 、 成 本 预算 和 成 本 控制 等 构成 。 

(4) 项 目 质量 管理 : 是 拱 用 以 保证 项 目 满足 其 所 执行 标准 的 要 求 而 所 需要 的 各 个 过 程 , 由 质 
量 计划 、 质 量 保证 措施 和 质量 控制 等 构成 。 质 量 计划 是 质量 管理 的 起 始点 , 质量 计划 需要 反映 
项 目 质量 管理 中 的 各 个 方面 。 

(5) 项 目 人 力 资 源 管理 : 是 用 以 保证 参加 项 目的 人 员 能 够 被 最 有 效 使 用 而 所 需要 的 各 个 过 
程 , 由 组 织 的 计划 编制 .人员 获得 和 队伍 组 建 等 构成 。 项 目 人 员 由 管理 人 员 和 实施 人 员 两 部 分 
组 成 ,管理 人 员 是 人 员 组 成 中 的 关键 , 也 是 项 目 管理 的 主要 实施 人 。 

(6) 项 目 沟通 管理 : 是 用 以 保证 项 目 信息 能 够 被 及 时 、 正 确 地 产生 、 收集、 发布、 储存 和 最 终 
处 理 而 所 需要 的 各 个 过 程 , 由 沟通 计划 ,信息 发 送 .绩效 报告 等 构成 。 

(7) 项 目 风险 管理 : 是 有 关 识 别 、 分 析 和 应 对 项 目 风险 的 各 个 过 程 , 由 风险 管理 计划 、 风 险 识 








| 别 、 风 险 分 析 、 风 险 应 对 和 风险 监控 等 构成 。 


(8) 项 目 采购 管理 : 是 用 以 从 执行 机 构 以 外 获得 物资 和 服务 的 各 个 过 程 , 由 采购 计划 、 询 价 
计划 、 供 方 选择 和 合同 管理 等 组 成 。 

(9) 项 目 文档 管理 : 临床 试验 完成 后 的 档案 资料 是 必 不 可 少 的 , 试验 过 程 中 的 各 种 会 议 纪要 
是 质量 控制 和 合同 管理 的 重要 组 成 部 分 ， 是 试验 完成 后 充分 利用 资料 的 根本 保证 。 


第 四 节 队列 研究 


队列 研究 (cohort study ) 是 探讨 疾病 病因 的 常用 方法 之 一 , 其 论证 强度 较 高 , 能 较 好 地 揭示 


| 两 事件 间 客 观 存在 着 的 因果 关系 。 而 其 设计 原理 也 常常 用 在 疾病 预后 ( 见 本 教材 第 十 一 章 )、 临 


床 试验 等 研究 中 。 


(一 ) 概念 0 
队列 研究 是 将 一 群 (组 ) 研 究 对 象 (队列 ) 按 是 否 暴露 (exposure) 于 某 研究 因素 分 为 暴露 组 与 
非 暴露 组 (对 照 组 ), 随访 观察 适当 长 的 时 间 , 比较 两 组 之 间 所 研究 疾病 (或 事件 ) 的 发 病 率 ( 或 
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发 生 率 ) 或 死亡 率 差异 , 从 而 判断 这 个 ( 些 ) 暴 露 因素 与 疾病 之 间 有 无 关联 及 关联 大 小 的 一 种 观 
察 性 研究 方法 。 队 列 研究 又 被 称 为 群 组 研究 、 定 群 研究 、 前 瞻 性 研究 (prospective study ) 等 ,但 以 
队列 研究 这 一 名 称 最 常用 。“ 暴 露 "是 指 研究 对 象 接触 过 某 种 因素 (如 重金 属 ), 或 具有 某 些 特征 
(如 年 龄 .性 别 、 遗 传 ) 行 为 (如 吸烟 )。 暴 露 可 以 是 危险 因素 , 也 可 以 是 保护 因素 。 

(二 ) 特点 

1. 属于 观察 性 研究 , 队列 研究 中 所 观察 的 暴露 因素 不 是 人 为 给 予 的 , 而 是 客观 存在 于 研究 
人 和 群 中 , 研究 因素 的 暴露 情况 及 其 变化 是 由 研究 者 观察 获得 的 。 

2. 属于 “前瞻 性" 研究 , 研究 开始 时 , 研究 的 疾病 尚未 发 生 , 或 观察 的 临床 结局 尚未 出 现 ， 
随访 一 段 时 间 后 , 才能 观察 到 研究 的 结局 是 否 发 生 。 

3. 研究 对 象 按 是 否 暴露 于 所 研究 的 因素 分 为 暴露 组 和 非 暴露 组 , 其 暴露 状况 已 客观 存在 ， 
研究 者 不 能 将 其 随机 化 分 配 。 

4. 由 “ 因 ” 推 “ 果 ”, 符合 先 因 后 果 的 推理 逻辑 。 


二 .设计 模式 
队列 研究 设计 的 基本 原理 见 图 4-4。 队 列 研究 按 其 研究 时 间 的 起 止 点 (时 序 ), 又 可 分 为 三 
种 设计 模式 : 前 瞻 性 队列 研究 、 回 顾 性 队列 研究 和 双向 性 队列 研究 。 














研究 开始 





4-4 队列 研究 基本 原理 示意 图 


1. 前 脆性 队列 研究 (prospeetive cohort study) 是 指 观察 时 间 从 现在 开始 ， 追踪 观察 到 将 来 
某 个 时 间 , 了 解 其 发 病 或 死亡 情况 , 以 确定 某 暴露 因素 与 疾病 的 关系 。 通 常 提 到 的 队列 研究 就 
是 指 这 种 研究 ; 是 队列 研究 的 基本 形式 。 

2. 回顾 性 队列 研究 (retrospective cohort study) 是 指 以 过 去 某 个 时 间 为 起 点 ， 收集 基线 和 暴 
露 资 料 , 以 当时 人 群 对 研究 因素 的 暴露 情况 将 其 分 为 暴露 组 和 非 暴露 组 , 追踪 观察 到 现在 发 病 
或 死亡 的 结局 情况 , 以 研究 暴露 与 疾病 的 关系 。 这 种 设计 模式 又 称 为 历史 性 队列 研究 (historical 
prospective study )。 回 顾 性 队列 研究 的 前 提 是 过 去 有 关 暴 露 与 发 病 的 记录 必须 准确 和 完整 。 尽 
管 收 集 暴露 与 结局 资料 的 方法 是 回顾 性 的 , 但 究 其 性 质 而 言 仍 是 从 因 到 果 的 研究 方法 。 

3. 双向 性 队列 研究 (ambispective cohort study ) 是 指 在 回顾 性 队列 研究 之 后 ， 继续 追踪 观 
察 到 将 来 某 个 时 间 , 又 称 为 混合 型 队列 研究 , 它 是 前 脆性 队列 研究 和 历史 性 队列 研究 方法 的 结 
合 , 兼 有 上 述 两 种 队列 研究 的 优点 , 并 在 一 定 程度 上 弥补 了 相互 的 不 足 。 在 进行 回顾 性 队列 研 
究 的 过 程 中 , 如 果 从 暴露 到 现在 不 能 达到 观察 结果 所 需 的 足够 观察 时 间 , 还 需 继 续 前 脆性 观察 
一 段 时 间 时 , 就 可 选用 双向 性 队列 研究 。 
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三 ,实施 方案 

在 确定 开展 某 因素 (如 : 吸烟 ) 和 结局 (如 : 肺癌 ) 因 果 关 联 的 队列 研究 后 , 实施 方案 的 制订 
是 研究 成 败 的 关键 一 环 。 

(一 ) 研究 对 象 的 选择 

1. 研究 现场 ”由 于 大 多 队列 研究 的 随访 时 间 较 长 . 因此 研究 现场 必须 有 足够 的 人 只 煞 量 ， 
人 口 相对 稳定 , 当地 的 领导 重视 ,群众 理解 和 支持 , 愿意 合作 , 当地 也 要 有 较 好 的 医疗 条 件 , 交 
通 便利 , 便于 随访 ， 人 口 流动 大 的 地 区 或 单位 , 失 访 率 会 较 高 .对 结果 有 和 较 大 影响 ,一 般 不 适 于 
作为 研究 现场 。 

2. 研究 人 群 ， 研 究 人 群 包 括 暴露 组 和 非 暴 露 组 , 根据 研究 且 的 和 研究 条 件 的 不 同 , 研究 人 
群 有 不 同 的 选择 方式 。 

(1) 暴露 组 : 即 对 研究 因素 有 暴 包 的 人 群 。 通 常 可 以 选择 在 某 社区 或 地 理 区 域内 居住 的 全 
体 人 群 ,其 中 暴走 于 某 研究 因素 (如 : 吸烟 ) 的 人 群 即 为 暴露 组 。 如 果 要 研究 一 些 特殊 暴露 、 职 
业 暴 露 与 疾病 的 关系 , 往往 要 选择 特殊 或 职业 人 群 , 因为 这 些 特殊 暴露 人 群 某 种 疾病 的 发 病 率 
或 死亡 率 高 于 其 他 --- 般 人 群 , 有 利于 探索 该 暴露 因素 与 疾病 之 间 的 联系 。 如 选择 石棉 作业 工人 
研究 石棉 与 肺癌 的 关系 等 。 职 业 人 群 有 关 暴 露 与 疾病 的 历史 记录 较为 全 面 、 真 实 和 可 靠 , 因此 
常 作为 历史 性 队列 研究 的 暴露 人 群 。 

(2) 非 暴露 组 : 即 对 照 人 群 。 观 察 人 群 确 定 后 , 将 其 中 暴露 于 所 研究 因素 的 对 象 作为 暴露 
组 , 其余 即 为 非 聚 露 组 (如 : 不 吸烟 者 )。 但 非 暴露 组 人 妖 与 暴露 组 要 有 可 比 性 。 对 照 人 群 除 未 
暴露 于 所 研究 因素 外 , 其 他 因素 或 一 般 人 口 学 特征 (年 龄 .性别 .民族 等 ) 都 尽 可 能 地 与 
人 群 相 同 。 但 是 . 当 以 特殊 暴露 人 群 (包括 职业 人 群 ) 作 为 暴露 组 时 , 不 应 在 同一 人 群 先 
组 , 而 应 在 与 该 暴 露 或 职业 无 关 的 另 一 人 群 中 选择 对 照 。 如 在 研究 二 硫化 碳 (CS:) 与 冠 心病 的 
关系 时 , 就 以 有 CS, 梁 露 史 的 纤维 厂 的 工人 作为 暴露 组 , 而 以 附近 造纸 三 的 工人 作为 非 
从 中 可 乔 出 ,对 于 非 暴 句 组 的 设置 .临床 研究 中 通常 多 在 同一 群体 中 进行 , 调 “ 内 对 照 
某 种 环境 因素 的 致 病 效应 时 , 则 对 照 组 ( 非 暴露 组 ) 应 在 无 该 因素 的 地 区 或 人 群 中 选择 , 汤 “ 外 
对 照 ”。 

《二 ) 样本 圳 的 估计 

1. 样本 量 估计 有 关 的 参数 ”估计 祥 本 含量 之 前 , 必须 确定 下 述 参数 : 

(1) 非 渗 需 人 群 或 全 人 和 群 中 被 研究 疾病 的 发 病 率 ( Po): 可 通过 查阅 文献 或 预 注 查 获得 。A 
越 接近 0.5, 所 需 样本 量 越 大 

(2) 暴露 人 群 中 的 发 病 率 ( P, ): 可 通过 查阅 文献 或 预 调查 获得 。 如 果 已 知 弄 期 祖 对 危险 度 
(RR), 则 可 通过 公式 P1=RR x P, 求 得 。P1- P, 差 值 起 大 , 所 需 样本 量 越 小 。 

(3) 显著 性 水 平 (a 值 ); 是 检验 假设 时 的 了 型 错误 ( 假 阳 性 错误 )o 值 。 假 阳性 错误 出 现 的 概 
率 越 小 , 所 需 样本 量 越 大 , 一般 情况 取 a=0.05 或 0.01。 

(4) 把 握 度 (1~p8); 又 称 为 检验 效能 (power), 反映 能 够 发 现 疾 病 与 病因 之 间 确 实 存 在 关系 
的 概率 。8 是 检验 假设 时 T 型 错误 ( 假 阴 性 错误 ) 的 概率 , 把 握 度 越 高 .8 值 越 小 , 所 需 的 样本 量 
越 大 ,通常 取 h=0.10 或 0.20， 

2. 样本 量 估算 方法 ”估计 样本 量 , 常用 两 种 方法 : 查 表 法 与 公式 法 。 查 表 法 根据 已 知 的 上 
述 a、p、P 和 RE 四 个 基本 参数 ,可 从 参考 书 的 相应 附 表 上 查 出 。 公 式 法 如 下 所 述 : 

在 暴露 组 和 对 照 组 样本 量 相等 的 情况 下 . 可 用 下 式 计算 出 各 组 所 需 的 样本 量 ， 


























nn (ZN2PO + VRQO,+PO,) 
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式 中 : P, 和 Po 分 别 代 表 暴露 组 和 对 照 组 预期 发 病 率 , P=(Po+P1)/2,O=1-P, Oo=1-Po，, 
Q1=1 一 Pi, 2Z。、2 为 标准 正 态 分 布下 的 面积 。 

在 计算 样本 量 时 一 般 按 10%~20% 估计 失 访 率 , 所 以 应 在 原 估 计 样 本 量 的 基础 上 加 10% 以 
上 作为 实际 样本 量 。 

(三 ) 资料 的 收集 与 随访 

1. 收集 基线 资料 ”队列 人 群 确定 后 , 应 全 面 收 集 每 个 研究 对 象 在 研究 开始 时 的 基本 信息 ， 
即 基线 资料 (baseline information ), 这 些 资料 是 区 分 暴露 组 和 非 暴露 组 ， 判定 研究 结局 的 重要 依 
据 。 资 料 收 集 的 方法 包括 : @D 调 查询 问 : 调查 的 内 容 包 括 一 般 人 口 学 特征 (如 性 别 .年龄 .职业 、 
民族 、 居 住地 、 经 济 收入 等 ) 研 究 因素 的 暴露 情况 (如 吸烟 、 饮 酒 等 ) 及 身体 健康 状况 等 。@ 查 
阅 现成 记录 : 如 常规 的 出 生死 亡 登 记 , 各 种 人 口 与 疾病 统计 , 医院 病历 , 户口 登记 等 。@ 体 格 检 
查 和 实验 室 检 查 : 对 于 身高 、 体 重 、 血压、 血脂 、 血 糖 等 研究 相关 指标 需 做 相应 的 检查 。@ 环 境 
调查 和 检测 等 。 

2. 随访 观察 ”暴露 因素 确定 后 , 结局 事件 的 发 生 往往 需要 一 定 的 时 间 , 在 这 个 过 程 中 , 就 必 
须 对 研究 对 象 进行 随访 (follow up)。 并 要 根据 研究 目的 和 具体 病 种 确定 随访 间隔 时 间 和 终止 时 间 。 

随访 对 象 是 暴露 组 和 非 烘 露 组 的 所 有 研究 对 象 。 在 相同 时 期 内 以 相同 的 方式 对 两 组 人 群 
进行 随访 。 绝 对 不 可 有 先 有 后 , 中 途 放弃 或 漏 访 。 随 访 方法 与 基线 资料 的 收集 方法 相同 , 值得 
注意 的 是 , 随访 方法 在 整个 随访 过 程 应 保持 不 变 。 





随访 内 容 依 研究 目的 和 设计 要 求 不 同 而 各 异 。 一 般 而 言 , 应 与 收集 基线 资料 的 内 容 和 方法 





一 致 。 但 是 应 重点 观察 以 下 内 容 : 暴露 人 群 暴露 情况 及 程度 有 无 改变 。 如 吸烟 者 吸烟 量 有 无 
变化 ,是 否 戒烟 等 ; 对 某 些 定量 指标 如 血压 、 血糖 等 进行 体格 检查 和 实验 室 检查 。@@ 收 集结 
相关 资料 。 如 发 病 日 期 、 入 院 时 间 、 诊 断 方法 ,死亡 原因 、 死 亡 时 间 和 地 点 等 。@ 人 口 变 动 的 ' 
况 。 如 进入 、 退 出 、 失 访 人 数 等 。 

3. 观察 终点 ”随访 观察 终点 (end-point) 多 为 发 生 疾病 或 死亡 , 但 必须 是 研究 所 限定 的 疾病 
或 死亡 。 观 察 过 程 中 发 生 其 他 疾病 或 死亡 不 能 视 为 结局 。 如 研究 高 血压 和 冠 心病 的 关系 , 则 观 
察 终点 是 冠 心病 , 随访 过 程 中 , 研究 对 象 发 生 了 肿瘤 或 其 他 疾病 , 则 不 能 认为 是 到 了 观察 终点 ， 
应 继续 随访 ; 此 时 如 果菜 研究 对 象 死 于 肝癌 , 应 作为 失 访 处 理 , 不 能 视 为 结局 。 终 点 指标 与 测 
量 标 准 都 应 在 研究 设计 阶段 做 出 明确 规定 , 在 观察 中 途 不 能 改变 , 对 全 部 人 群 应 按 事先 制定 好 
的 诊断 标准 统一 进行 评价 , 否则 将 造成 结果 的 偏 倚 。 

队列 研究 观察 时 间 较 长, 在 随访 过 程 中 应 加 强 质量 控制 , 以 保证 研究 结果 的 可 靠 性 和 准确 性 。 


四 、 资 料 的 整理 与 分 析 
队列 研究 资料 主要 是 计算 暴露 组 和 非 暴露 组 的 发 病 率 或 死亡 率 , 检验 其 差异 的 显著 性 ,分 
析 暴 露 因素 与 发 病 或 死亡 之 间 是 否 有 联系 。 如 存在 联系 则 进一步 计算 相对 危险 度 等 指标 , 分 析 
联系 的 强度 。 
队列 研究 资料 整理 的 基本 形式 见 表 4-5。 表 中 暴露 组 的 发 病 率 为 a/(a+45), 非 暴露 组 的 发 
病 率 为 c/(c+q), 在 控制 各 种 偏 倚 后 , 如 果 暴 露 组 的 发 病 率 显著 高 于 非 暴 露 组 日 有 统计 学 意义 ， 
则 说 明 暴 露 因素 与 该 疾病 有 一 定 关联 , 且 很 可 能 是 因果 关系 。 





mm 





表 4-5 ”队列 研究 资料 整理 表 





组 别 病例 非 病例 合计 
暴露 组 a b a+b 
非典 露 组 C 过 cta 





合计 QT+C b+d atbi+c+d 
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1. 率 的 计算 ”队列 研究 计算 的 发 病 概率 与 普通 发 病 率 不 同 ,根据 队列 人 群 的 数量 、 稳 定 程 
度 、 发 病 强度 和 观察 时 间 的 不 同 , 可 以 计算 累积 发 病 率 、 发 病 密度 等 指标 。 

(1) 累积 发 病 率 (cumulative incidence. C7): 当 研 究 对 象 人 数 较 多 , 人 口 稳 定 , 观察 时 间 较 短 ， 
资料 比较 完整 , 且 失 访 人 数 较 少 时 , 以 该 研究 人 群 观察 开始 时 的 人 口 作 分 母 , 以 观察 期 内 某 病 
的 新 发 病例 数 作 为 分 子 计算 累积 发 病 率 。 累 积 发 病 率 的 量 值 变化 范围 为 0~1, 其 数值 高 低 受 研 
究 时 间 长 短 的 影响 ,报告 累积 发 病 率 时 应 说 明 观 察 时 间 的 长 短 。 

累积 发 病 率 的 基本 计算 公式 为 : 





4 某 病 累 积 发 病 率 -_ 了 年 内 的 新 发 病例 数 。 ,1000%o( 100000/10 万 ) 
”年 的 某 病 累积 发 病 率 ~ 年 内 的 平均 暴 震 人 口 玫 2 


(2 ) 发 病 密度 (incidence density, ID): 当 研 究 人 群 观察 时 间 较 长 ， 研究 对 象 不 断 增 减 、 队 列 
人 和 群 难以 稳定 时 , 则 需要 以 人 时 (person-time, PT7) 为 单位 代替 平均 人 口 数 作 分 母 来 计算 率 。i 
时 计算 出 来 的 是 一 种 人 口 数 有 “变动 ”的 发 病 率 , 即 发 病 密度 , 而 不 是 静止 的 累积 发 病 率 。 计 
算 发 病 密度 时 ,分 子 为 观察 期 间 研究 疾病 的 发 病 数 , 分 母 则 不 是 普通 的 人 口 数 , 而 是 用 人 时 来 
表示 。 人 时 等 于 观察 人 数 乘 以 随访 时 间 , 人 时 单位 可 为 人 年 、 人 月 等 , 通常 用 人 年 来 表示 。 如 
1000 人 观察 了 1 年 或 100 人 观察 了 10 年 均 为 1000 人 年 。 这 种 以 人 时 计算 的 发 病 密度 又 称 为 人 
时 发 病 率 。 在 比较 几 项 随访 时 间 不 等 的 前 瞻 性 研究 的 发 病 率 时 多 用 发 病 密度 。 

发 病 密度 的 计算 公式 如 下 : 
某 人 群 在 观察 期 内 的 发 病 数 
观察 期 内 的 观察 对 象 人 年 数 

计算 人 年 的 常用 方法 有 近似 法 和 寿命 表 法 。 

2. 联系 强度 的 估计 “ 当 统 计 学 检验 提示 暴露 与 疾病 具有 显著 的 统计 学 意义 时 , 应 进一步 
计算 联系 的 强度 。 常 用 的 指标 有 以 下 几 种 。 

G19 相对 危险 度 (relative risk, RR): 又 称 率 比 (rate ratio )， 是 暴露 组 发 病 ( 或 死亡 ) 率 ( Z.) 与 非 
暴露 组 发 病 ( 或 死亡 ) 率 (二 ) 的 比值 。 它 表明 暴露 组 发 病 或 死亡 的 危险 性 为 非 县 露 组 的 倍数 。 
其 计算 公式 为 : 





x 100 000/10 万 





发 病 密度 = 











RR 的 95% 可 信 区 间 = RR 
在 队列 研究 中 RR 值 是 反映 暴露 与 疾病 联系 强度 的 重要 指标 之 一 , 反映 了 暴露 于 某 因素 所 
致 的 发 病 (或 死亡 ) 率 是 不 暴露 者 的 倍数 , 具有 病因 学 意义 。RR< 1 说 明 暴 露 因 素 是 疾病 的 保护 
因素 , RR> 1 说 明 暴露 因素 是 疾病 的 危险 因素 , RR= 1 说 明 暴 露 因 素 与 疾病 无 联系 。 
(2) 归 因 危险 度 (attributable risk, 4R): 又 称 特异 危险 度 或 率 差 (rate difference )。 是 指 暴 露 
组 的 发 病 率 或 死亡 率 (7) 与 非 暴露 组 的 发 病 率 或 死亡 率 (7,) 之 差 。4R 表示 暴露 者 中 完全 由 某 暴 
露 因素 所 致 的 发 病 率 或 死亡 率 , 公式 如 下 : 
AR=1,.—1L, 
或 4R=L(RR-1) 
AR 的 95% 可 信和 区 间 =AR*”* 人 
4R 说 明 暴 露 人 和 群 比 非 暴露 人 群 增加 的 疾病 发 生 率 , 如 果 去 除 该 因素 , 就 可 减少 这 个 数量 的 
人 发 病 , 因此 更 具 疾 病 预 防 和 公共 卫生 意义 。 
(3) 归 因 和 危险 度 百分比 (attributable risk percent, AR%): 表示 暴露 者 中 由 暴露 所 致 的 发 病 率 
或 死亡 率 (7. 一/ ) 占 暴露 者 发 病 率 或 死亡 率 (7) 的 百分比 。4R% 与 RR 的 大 小 有 关 。 公式 如 下 : 
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je 


AR%= 





x100% 


RR-1 
或 4R%= 
或 4R% 





x100% 


(4) 人 和 群 归 因 危 险 度 (population attributable risk, P4R ): 表示 整个 人 群 中 ， 暴露 因素 所 引起 的 
发 病 率 增高 的 部 分 , 又 称 为 病因 分 值 (etiologic fraction )。 是 整个 人 群 中 该 疾病 的 发 病 ( 或 死亡 ) 
率 (7) 与 非 暴露 人 群发 病 (或 死亡 ) 率 (了 ) 之 差 。 表 示人 和 群 中 因 暴 露 于 某 因素 所 致 的 发 病 (或 死 
亡 ) 率 。 其 计算 公式 为 : 





PAR=1,-L, 

(5) 人 群 归 因 危险 度 百分比 (population attributable risk percent, P4R% ): 表示 人 群 中 由 于 暴 
露 所 致 的 发 病 率 或 死亡 率 占 人 群 总 发 病 率 或 死亡 率 的 百分比 。P4R9% 在 卫生 行政 部 门 制订 疾病 
预防 策略 时 需 加 以 考虑 , 也 可 用 于 疾病 预防 的 宣传 教育 , 它 可 向 群众 说 明 在 完全 控制 该 暴露 因 
素 后 人 群 中 某 病 发 病 ( 或 死亡 ) 率 可 能 下 降 的 程度 。 其 计算 公式 为 : 


Lh 


PAR%= 





x100% 


t 


五 .应 用 范围 


1. 疾病 预后 研究 ”队列 研究 可 以 观察 人 群 暴露 于 某 因素 后 , 疾病 逐渐 发 生 、 发 展 , 直至 结 
局 的 全 过 程 , 包括 亚 临床 阶段 的 变化 与 表现 , 因此 队列 研究 不 仅 可 以 了 解 个 体 疾病 的 自然 史 ， 
而 且 可 了 解 疾病 在 整个 人 群 中 发 展 和 流行 过 程 。 队 列 研究 , 特别 是 前 瞻 性 队列 研究 成 为 疾病 预 
后 研究 的 首选 设计 方案 。 

2. 检验 病因 假设 ”检验 病因 假设 是 队列 研究 的 主要 用 途 和 目的 。 一 般 说 来 , 队列 研究 往往 
是 明确 因果 联系 最 有 力 的 方法 。 

3. 评价 预防 效果 ”发现 暴露 因素 对 预防 疾病 常常 具有 明显 的 作用 。 如 戒烟 可 减少 既往 吸 
烟 者 发 生 肺 癌 的 危险 , 那么 对 戒烟 效果 的 评价 就 是 队列 研究 的 目的 。 

4. 新 药 上 市 后 监测 及 疗效 比较 研究 ( comparative effectiveness research, CER) 新 药 通过 三 
期 临床 试验 上 市 后 , 还 需要 对 其 不 良 反 应 等 进行 长 期 监测 , 队列 研究 可 以 更 大 样本 和 更 长 时 间 
地 观察 该 新 药 的 各 种 不 良 反应 。 

此 外 , 在 疗效 比较 研究 中 , 也 可 进行 队列 研究 , 如 大 型 临床 注册 研究 (patient registry study ) 等 。 


六 、 优 缺点 
1. 优点 “符合 病因 链 先 因 后 果 的 时 间 顺 序 , 验证 病因 与 疾病 之 问 的 因果 关系 论证 强度 高 ; 
可 以 直接 计算 暴露 组 和 对 照 组 的 发 病 率 或 死亡 率 , 获得 RR、A4R 等 指标 ; 一 般 不 存在 回忆 偏 倚 ; 
可 以 了 解 疾病 的 自然 史 ; 能 对 暴露 因素 所 致 的 多 种 疾病 同时 进行 观察 , 从 而 获得 一 种 病因 与 多 
种 疾病 的 可 能 因果 关系 。 
2. 缺点 ”所 需 研究 时 间 长 ,样本 量 大 , 人 力 、 物 力 投入 大 , 容易 产生 失 访 偏 倚 , 通常 不 适用 
于 发 病 率 低 、 潜 伏 期 长 的 疾病 病因 研究 。 




















〈 闫 永 平 ) 


第 五 节 ”病例 对 照 研究 





病例 对 照 研究 (case-control study ) 是 临床 上 开展 病因 研究 最 具 实 用 价值 的 一 种 设计 方案 , 它 
通过 科学 合理 的 对 照 设置 , 可 以 在 一 定 程度 上 防止 偏 倚 的 干扰 , 是 探讨 病因 及 危险 因素 的 最 为 





笔记 
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常用 研究 设计 之 一 , 同时 对 于 治疗 效果 和 预后 等 方面 的 研究 也 可 选用 此 方案 , 而 且 随 着 病例 对 
照 研究 方法 的 不 断 完善 , 其 应 用 范围 也 在 不 断 扩大 。 


一 . 概 述 





(一 ) 概念 

病例 对 照 研究 是 选择 一 组 患 有 所 研究 疾病 的 人 作为 病例 组 , 选择 一 组 不 患 有 所 研究 疾病 的 
人 作为 对 照 组 , 调查 这 两 组 人 对 某 个 ( 些 ) 因 素 的 既往 暴露 情况 , 通过 比较 两 组 间 暴 露 率 或 暴露 
水 平 的 差异 , 用 以 判断 该 疾病 与 这 个 ( 些 ) 因 素 的 关系 。 因 为 这 种 研究 方法 是 比较 病例 组 与 对 照 
组 既往 的 暴露 史 , 在 时 间 上 是 “回顾 性 ” 的, 故 又 称 为 回顾 性 研究 (retrospective study )- 

(二 ) 特点 

1. 按 发 病 与 否 分 成 病例 组 与 对 照 组 , 病例 对 照 研究 是 在 疾病 (事件 ) 发 生 后 进行 的 , 此 时 已 








有 一 批 可 供 选择 的 病例 。 然 后 再 选择 一 组 无 所 研究 疾病 的 人 作为 对 照 组 。 
2. 调查 的 暴露 情况 是 由 研究 对 象 从 现在 对 过 去 的 回顾 。 也 就 是 说 , 我 们 关注 的 是 研究 开 
始 之 前 , 病例 组 和 对 照 组 对 所 要 研究 因素 的 暴露 情况 。 


3. 由 * 果 " 推 * 因 ", 研 究 中 是 先 有 结果 , 即 已 知 研究 对 象 患 某 病 或 不 患 某 病 , 再 追溯 其 可 能 
与 疾病 有 关 的 原因 。 

4. 病例 对 照 研究 受到 回顾 性 观察 方法 的 限制 , 不 能 观察 到 由 “ 因 ” 到 “ 果 ” 的 发 展 过 程 并 证 
实 其 因果 关系 。 只 能 通过 两 组 暴露 率 的 比较 来 分 析 暴露 与 疾病 是 否 有 关联 。 

二 .设计 模式 

(一 ) 病例 对 照 研究 

病例 对 照 研究 的 基本 原理 见 图 4-5。 若 病例 组 某 因素 的 暴露 率 或 暴露 水 平 明 显 高 于 对 照 
组 , 且 研 究 过 程 又 无 明显 的 偏 倚 , 则 该 因素 或 措施 与 所 研究 的 疾病 有 联系 。 病 例 对 照 研 究 可 分 
为 成 组 病例 对 照 研究 ( group case-control study ) 和 配对 病例 对 照 研究 (matched case-control study )- 











时 间 方 向 








调查 方向 
图 4-5 ”病例 对 照 研究 设计 基本 原理 示意 图 





1. 成 组 病例 对 照 研究 ”在 设计 时 对 病例 组 和 对 照 组 人 群 在 数量 上 没有 严格 的 配 比 关系 ， 
对 照 组 人 群 数量 可 等 于 、 多 于 或 少 于 病例 组 人 数 。 
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2. 配对 病例 对 照 研究 ”要求 对 照 组 在 某 些 因素 或 特性 上 与 病例 组 保持 相同 , 形成 匹配 关 
系 , 而 且 数量 上 也 要 是 配 比 关系 ,如 1:1 或 1:2 等 。 

(二 ) 巢 式 病例 对 照 研究 

病例 对 照 研究 与 队列 研究 作为 探讨 疾病 病因 等 观察 性 研究 的 主要 方法 ,已 为 国内 外 广泛 使 
用 。 由 于 此 两 种 方法 各 有 其 优势 与 不 足 , 且 两 法 正好 优势 互补 , 因此 在 实践 过 程 中 产生 了 这 一 
扬长 避 短 的 新 研究 类 型 。 

集 式 病例 对 照 研究 (nested case-control study ) 是 队列 研究 和 病例 对 照 研究 的 结合 , 其 设计 模 
式 是 : 首先 设计 一 项 队列 研究 , 收集 基线 资料 , 采集 所 研究 生物 学 标志 物 的 组 织 或 体液 标本 储 
存 备用 , 继 之 随访 至 能 满足 病例 对 照 研究 样本 量 的 病例 数 为 止 。 将 这 些 病例 作为 病例 组 , 按 病 
例 进 入 队列 的 时 间 与 性 别 、 年 龄 等 配 比 条 件 , 从 同一 队列 中 选择 1 个 或 数 个 非 病例 作对 照 , 抽取 
病例 与 对 照 的 基线 资料 并 检测 收集 的 标本 , 资料 按 病例 对 照 研究 的 分 析 方 法 进行 统计 分 析 和 因 
果 推 论 。 这 种 设计 模式 的 主要 优点 是 研究 对 象 选择 偏 倚 小 , 可 以 较 好 地 避免 回忆 偏 倚 ,研究 和 
统计 检验 效率 高 , 论证 强度 明显 强 于 传统 的 病例 对 照 研究 。 

三 .实施 方案 

在 提出 开展 病例 对 照 研 究 的 病因 假设 后 , 就 需要 制订 出 一 套 科 学 合理 的 实施 方案 。 

(一 ) 研究 对 象 的 选择 

研究 对 象 选择 的 原则 有 两 个 : 第 一 , 具有 代表 性 : 病例 组 应 能 代表 目标 人 群 中 患 该 病 的 总 
体 ; 对 照 组 能 代表 目标 人 群 中 未 患 该 病 的 总 体 ; 第 二 , 具有 可 比 性 : 病例 组 与 对 照 组 在 年 龄 、 性 
别 、 居 住地 、 社 会 经 济 文化 等 主要 特征 方面 应 可 比 。 

1. 病例 组 的 选择 ”被 选择 的 病例 , 诊断 必须 正确 可 靠 , 不 能 将 诊断 不 明 或 误诊 的 病例 作为 
“病例 组 ”, 否则 会 产生 错误 分 类 偏 倚 而 造成 低估 疾病 与 暴露 因素 的 关系 ; 其 次 , 被 选择 的 病例 ， 
应 具有 暴露 于 调查 (研究 ) 因 素 的 可 能 性 , 否则 应 予 排除 。 例 如 , 探讨 口服 避孕 药物 与 某 些 疾病 
的 关系 时 , 对 做 过 绝育 术 或 因 其 他 原因 而 鼠 用 口服 避孕 药物 者 则 不 能 选 和 人; 此 外 , 应 纳入 新 病 
例 作为 研究 对 象 , 以 减少 回忆 偏 倚 的 影响 等 。 

关于 病例 组 的 来 源 , 宜 在 同一 地 区 不 同 水 平 的 医院 选用 一 个 时 期 内 符合 要 求 的 连续 性 病 
例 , 旨 在 一 定 的 程度 上 防止 选择 性 偏 倚 的 影响 。 若 条 件 许可 , 可 选择 社区 总 体 人 群 中 的 全 部 病 
例 ( 适 于 患 病 率 低 的 疾病 ) 或 者 从 中 随机 抽样 , 其 代表 性 更 好 。 

2. 对 照 组 的 选择 ”被 选择 的 “对 照 ”, 必须 确实 排除 患 有 所 研究 的 疾病 , 否则 , 也 会 出 现 错 
误 分 类 ; 其 次 ,对 照 组 ”的 研究 对 象 也 应 具有 暴露 于 被 研究 因素 之 可 能 性 , 并 应 与 “病例 组 ” 同 
源 (医院 、 社 区 等 )。 

3. 病例 组 与 对 照 组 的 比较 方式 

(1) 成 组 法 : 按 和 病例 可 比 的 原则 , 选择 一 定数 量 的 对 照 。 对 照 与 病例 的 数量 不 需 呈 严格 的 
比例 关系 。 此 法 较 配 比 法 易于 实施 , 但 不 易 控制 混杂 因素 . 

(2) 配对 法 : 每 一 个 病例 选择 一 个 或 几 个 对 照 , 使 病例 与 对 照 配 成 对 (pair 或 block )， 而 对 照 
在 某 些 重要 特征 (如 年 龄 .性 别 等 ) 方 面 应 与 其 相配 的 病例 相同 或 基本 相同 。 这 些 特征 称 之 为 配 
比 因素 (matching factor)。 通过 配对 , 可 使 病例 组 与 对 照 组 有 可 比 性 , 较 好 地 控制 混杂 因 素 。 

病例 与 对 照 的 比例 ,一 般 为 1:1, 也 可 1:2, 但 不 超过 1:4。 应 注意 : 被 研究 的 因素 不 能 作 
为 配 比 因素 。 配 比 的 因素 不 应 过 多 , 否则 容易 发 生 “ 配 比 过 度 (overmatching)”, 不 仅 影响 结果 的 
可 靠 性 , 而 且 浪 费 精 力 。 

在 研究 中 , 可 设 多 组 对 照 , 如 既 选 医 院 的 病人 , 又 选 亲属 或 邻居 作为 对 照 。 这 不 仅 扩大 了 
对 照 的 来 源 , 减少 偏 倚 , 增强 代表 性 ; 同时 还 可 研究 疾病 与 被 研究 因素 在 不 同 水 平 之 间 的 关系 
或 发 现 另外 一 些 病因 线索 。 
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(二 ) 样本 量 的 估计 

开展 病例 对 照 研究 时 , 样本 量 的 估算 需要 预先 掌握 4 种 参数 , 包括 病例 组 和 对 照 组 各 自 研 
究 对 象 对 被 研究 因素 的 暴露 率 ; 预期 优势 比 ( OR); 容许 误差 的 值 和 8 值 。 病 例 组 和 对 照 组 样 
本 含量 相等 时 统计 效率 最 高 。 估 计 样 本 含量 的 公式 如 下 : 


| 二 VEG- 司 + PU-B)+B( =a)] 








> (BP-PB) 
或 简便 公式 : 
(Z,+2,)* x2P(—P) 
(8 
2: 样本 含量 ; Po: 对 照 组 暴露 率 ; P,: 病例 组 暴露 率 ; P=( 忆 + Po)/2。 其 中 , Z.、Z 可 根据 标 


准 正 态 分 布 简 表 查 出 ; P, 可 根据 Po 与 OR 推算 , 公式 为 : 
Pi= ORPo/(1—Po+ ORP,) 

(三 ) 资料 的 收集 

无 论 设计 多 么 严 并 ,资料 收集 过 程 中 若 方 法 不 恰当 ,将 会 产生 无 法 纠正 的 系统 误差 , 因而 
质量 控制 十 分 重要 。 

1. 资料 来 源 ”主要 来 源 于 设计 良好 的 调查 问卷 , 如 果 医 院 病例 记录 疾病 登记 报告 等 能 够 
满足 研究 所 需 , 也 可 从 中 摘录 , 对 调查 表 进 行 补充 。 

2. 收集 方法 ”主要 通过 询问 调查 、 查 阅 病历 等 方法 收集 资料 , 最 常用 的 是 访谈 、 信 访 及 电 
话 调 查 等 , 还 可 以 通过 查阅 资料 来 收集 。 
3. 调查 表 设 计 原 则 ”调查 表 的 设计 绝 非 易 事 , 一 张 好 的 调查 表 的 设计 需要 临床 医学 、 流 行 
病 学 、 统 计 学 、 心 理学 和 社会 学 的 专家 共同 讨论 拟定 , 并 经 反复 修订 和 预 调查 后 , 最 终 形成 后 方 
可 用 于 正式 调查 。 调 查 表 设 计 的 基本 原则 包括 : @ 调 查 条 目的 设置 要 全 而 精 ; @ 每 个 条 目 应 定 
义 明确 ; @ 调 查 条 目 应 有 具体 的 量化 标准 ; @ 条 目 中 的 问题 要 通俗 易 懂 , 尽量 口语 化 等 。 

四 、 资 料 的 整理 与 分 析 

对 原始 资料 进行 整理 核查 和 计算 机 录入 , 在 必要 的 数据 转换 后 , 首先 要 检验 病例 组 与 对 
照 组 是 否 具 有 均衡 性 , 即 在 研究 因素 以 外 的 其 他 主要 特征 方面 的 可 比 性 如 何 ? 计数 资料 常用 妨 
检验 , 计量 资料 常用 上 检 验 。 如 果 组 间 差异 无 统计 学 意义 , 提示 两 组 的 可 比 性 较 好 。 然 后 对 所 
研究 的 暴露 因素 进行 逐 项 整理 统计 , 计算 OR 值 和 其 他 指标 ; 若 存在 混杂 因素 则 应 做 分 层 分 析 ， 
涉及 多 因素 者 则 需 进行 多 因素 分 析 。 在 此 基础 上 , 对 被 研究 因素 和 疾病 的 关系 作 结论 。 

(一 ) 成 组 病例 对 照 研究 资料 的 结果 分 析 

如 果 设 计 、 资 料 收集 是 按 成 组 设计 进行 的 , 结果 分 析 同 样 应 按 成 组 设计 进行 。 成 组 法 资料 
整理 的 四 格 表 见 表 4-6。 
























































表 4-6 成 组 病例 对 照 研究 结果 分 析 用 四 格 表 











暴露 病例 组 对 照 组 合计 

有 a b at+b 

无 c d etd 
合计 ate b+d atbt+ctd=N 





1. 儿 检 验 ”分 析 暴露 与 疾病 之 间 是 否 有 统计 学 关联 。 
基本 公式 : 
(ad—bc)N 


Voraate nota 
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2. 优势 比 (odds ratio, OR) 病例 对 照 研究 计算 的 是 两 组 暴露 率 之 间 的 比值 , 也 称 为 比值 
比 。OR 值 的 计算 公式 为 : OR=ad/bc。 

OR 值 表示 病例 组 暴露 于 某 危 险 因素 的 比例 是 对 照 组 暴露 比例 的 多 少 售 。 当 OR 值 大 于 1 
时 ,说 明 暴露 因素 与 该 疾病 呈正 相关 ,疾病 的 危险 度 增加 , OR 值 越 大 , 危险 性 越 大 ; OR 值 小 于 
1 时 , 说明 研究 因素 与 该 疾病 呈 负 相关 , 疾病 的 危险 度 减 少 , OR 值 越 小 , 保护 作用 越 强 ; 当 OR 
值 等 于 1 或 接近 于 1 时, 说明 暴露 因素 与 患 病 之 间 无 联系 。 

(二 ) 配对 病例 对 照 研究 资料 的 结果 分 析 

成 组 资料 中 的 数字 表示 的 是 病例 组 和 对 照 组 的 人 数 , 而 配对 资料 中 的 数字 则 表示 的 是 对 子 
数 。 对 于 1:1 的 配对 资料 来 说 , 表格 中 的 数字 表示 1 个 病例 和 1 个 对 照 , 若 为 1:2 的 配对 资料 ， 
则 表示 1 个 病例 和 2 个 对 照 , 在 分 析 资 料 时 , 以 对 子 数 为 基础 , 不 拆 开 进行 分 析 , 最 为 常用 的 
1:1 配对 的 病例 对 照 研 究 资料 整理 如 表 4-7。 


表 4-7 ”配对 病例 对 照 研究 结果 分 析 用 四 格 表 











病例 4 
TI 3 
有 暴露 史 a b atb 
无 暴露 史 6 d ctd 
合计 atc b+d atb+c+d=N 


?检验 (McNemar 检 验 ) 和 OR 值 计算 公式 如 下 : 


1. 刀 检 验 
了 
尖 b+c 
2. OR 值 
C 
OR = 一 
b 


1:2、1:3 和 1:4 的 资料 整理 表 和 x 检验 、OR 值 计算 公式 与 1:1 配对 的 病例 对 照 研究 不 同 ， 
参见 相关 书籍 。 





五 .应 用 范围 


病例 对 照 研究 主要 用 于 疾病 危险 因素 的 探索 ,但 也 可 用 于 临床 筛 检 、 治 疗效 果 评 价 等 的 研究 。 

1. 探索 病因 和 危险 因素 ”从 20 世纪 中 叶 开始 已 有 大 量 有 关 疾 病 病因 的 病例 对 照 研究 。 如 
吸烟 与 肺癌 的 关系 、 孕 早期 服用 沙 利 度 胺 (反应 停 ) 与 婴儿 短 肢 畸 形 等 很 多 经 典 的 病例 对 照 研 
究 , 都 为 探 明 相 关 疾 病 的 病因 起 到 了 决定 性 的 作用 。 

2. 评价 得 检 试验 效果 ”20 世纪 80 年 代 以 来 , 很 多 学 者 应 用 病例 对 照 研究 方法 对 宫颈 涂 片 
检查 宫颈 癌 、 乳 房 照片 检查 乳腺 癌 、X 线 胸 透 得 检 肺 癌 等 进行 了 科学 评价 。 

3. 评价 干预 和 治疗 效果 “病例 对 照 研究 特别 适合 于 发 生 率 很 低 的 某 些 疾病 或 事件 研究 , 因 
为 此 时 很 难 进 行 随机 对 照 试验 (RCT)。 

4. 研究 药物 的 不 良 反应 ” 当 高 度 怀疑 某 种 药物 可 能 存在 某 些 不 良 反 应 时 ,病例 对 照 研究 常 
是 切实 可 行 的 方法 , 此 时 RCT 等 因 伦 理学 限制 而 无 法 实施 。 

实例 : 在 国家 “十 一 五 "传染 病 防治 科技 重大 专项 的 支持 下 ,第 四 军医 大 学 课题 研究 组 在 
甘肃 省 武威 市 开展 了 一 项 乙肝 感染 基线 调查 , 结果 发 现 , 尽管 当地 婴儿 的 乙肝 疫苗 接种 率 已 





学 了 
1b 
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为 此 ,我 们 联合 当地 妇 产 科 医 生 对 婴儿 乙肝 感染 的 危险 因素 进行 了 一 项 病例 对 照 研究 ,以 
2008 一 2010 年 在 武威 市 3 所 医院 妇 产科 分 娩 的 HBsAg 阳性 母亲 及 其 婴 幼 儿 作 为 研究 对 象 , 收 
集 这 些 母亲 孕期 、 分 娩 和 产后 的 医学 事件 ; 调查 婴儿 出 生 后 乙肝 疫苗 接种 时 间 、 剂 量 等 情况 , 检 
测 母亲 及 其 婴儿 乙肝 病毒 感染 标志 物 。 以 HBsAg 和 (或 )HBV DNA 阳性 的 婴儿 为 病例 组 , 阴性 
者 为 对 照 组 , 应 用 单 因素 和 多 因素 logistic 回归 模型 分 析 母 婴 传播 的 危险 因素 。 结 果 表 明 : 母亲 
HBV DNA 阳性 (OR=4.83, 95% CJ: 1.38~16.98, P=0.0140)、 早 产儿 或 低 体重 儿 出 生 时 推迟 接种 
首 针 乙 肝 疫 苗 (OR= 9.73, 95% C7: 1.78~53.21, P=0.0087 ) 是 该 地 区 乙肝 病毒 母 婴 传播 的 主要 
危险 因素 。 因 此 , 课题 组 建议 乙肝 防治 指南 中 应 对 该 部 分 高 危 人 群 的 乙肝 疫苗 接种 进行 具体 指 
导 。 在 循 证 医学 证 据 表明 乙肝 疫苗 接种 对 早产 儿 和 低 体 重 儿 无 毒 副作用 的 情况 下 ,所 有 婴儿 均 
应 执行 出 生 24 小 时 内 接种 乙肝 疫苗 的 规定 。 该 建议 已 为 当地 卫生 部 门 所 采纳 , 而 且 新 生 儿 乙 
肝 疫 苗 及 时 接种 率 也 纳入 到 了 当地 医院 医疗 质量 的 考核 指标 中 。 该 研究 成 果 发 表 在 了 国际 杂 
志 Vaccine 上 。 从 中 可 看 出 病例 对 照 研 究 在 探索 疾病 发 生 的 危险 因素 方面 具有 突出 的 实用 价值 
和 现实 意义 。 





六 、 优 缺 点 


1. 优点 ”所 需 样本 量 小 ,研究 对 象 易 找 , 工作 量 小 , 人 力 、 物 力也 较 少 , 因此 易于 进行 , 出 结 
果 快 , 可 以 对 一 种 疾病 的 多 种 病因 同时 进行 探讨 。 往 往 是 罕见 病 病 因 研究 的 唯一 设计 模型 。 

2. 缺点 “主要 是 容易 受到 回忆 偏 倚 的 影响 , 合理 的 对 照 选择 又 较 困难 , 偏 倚 可 能 较 大 , 论证 
强度 不 高 ; 另外 , 病例 对 照 研究 无 法 计算 发 病 率 , 只 能 推算 出 优势 比 。 





( 同 永 平 ) 


第 六 节 ”横断 面 研 究 


横断 面 研 究 (cross-sectional study ) 常 归 类 于 描述 性 研究 设计 但 其 研究 对 象 的 选择 “影响 因 
素 的 调查 及 其 结果 分 析 较 其 他 描述 性 研究 (如 病例 报告 等 ) 更 为 严密 和 规范 ; 而 且 通 过 对 患者 与 
非 患者 的 分 布 特征 和 影响 因素 分 析 还 可 以 进行 一 定 程度 的 比较 性 研究 。 因 此 , 横断 面 研究 常常 
是 进一步 开展 病例 对 照 研究 与 队列 研究 等 的 前 期 基础 , 尤其 是 在 疾病 的 患 病 率 调 查 和 人 群 、 地 
区 等 分 布 特征 研究 中 应 用 最 为 广泛 。 如 : 2010 年 开展 的 全 国 第 五 次 结核 病 现 况 调 查 .2012 年 启 
动 的 全 国 精神 障碍 流行 病 学 调查 等 , 这 些 研 究 为 我 国 相关 疾病 的 防治 和 卫生 决策 制订 提供 了 第 
一 手 资料 。 


一 . 概 述 


(一 ) 概念 

横断 面 研究 是 指 某 一 时 点 (或 期 间 ) 内 对 某 一 特定 人 群 中 的 疾病 患 病 ( 或 事件 发 生 ) 状 况 及 
其 影响 因素 (暴露 ) 进 行 的 调查 分 析 。 由 于 是 在 短 时 间 内 完成 , 如 一 天 、 一 周 或 一 个 月 , 日 调 查 
的 是 患 病 频率 , 因此 又 称 现 况 研究 , 或 现 患 率 人 研究 (prevalence study ) 

(二 ) 特点 

1. 在 设计 阶段 一 般 不 预 设 对 照 组 , 往往 是 先 对 全 部 研究 对 象 进行 调查 后 , 在 资料 处 理 阶 
段 ,再 根据 患 病 与 否 或 暴露 状态 进行 分 组 比较 。 

2. 调查 时 间 是 某 一 特定 时 间 点 或 时 间 段 , 对 于 患 病 率 来 讲 , 这 个 时 间 应 该 是 越 集中 越 准 确 。 

3. 在 确定 因果 联系 时 受到 限制 , 大 多 仅 能 提供 病因 线索 。 

4. 在 同一 人 群 定期 重复 开展 横断 面 调查 可 获得 发 病 率 、 新 发 感染 率 . 转 归 等 资料 
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二 、 设计 模式 
横断 面 研究 主要 是 通过 普查 或 抽样 方式 , 研究 目标 人 群 疾病 的 患 病 率 及 其 暴露 状况 , 设计 
的 基本 原理 如 图 4-6 所 示 。 
患 病 + 暴 露 
患 病 + 未 暴露 
未 忠 病 + 暴露 


未 患 病 + 未 暴露 





4-6 横断 面 研究 设计 原理 示意 图 


进行 横断 面 研究 的 方式 分 成 两 种 : 即 普查 与 抽样 调查 。 

1. 普查 (census) 是 指 在 特定 时 间 对 特定 范围 内 的 全 体 成 员 ( 总 体 ) 进 行 的 全 面 调查 。 普 
查 的 目的 主要 是 : @ 可 以 早期 发 现 .早期 诊断 和 早期 治疗 病人 , 如 很 多 地 区 开展 的 妇女 宫颈 瘤 
普查 ; @ 了 解 总 体 健康 状况 或 某 种 疾病 的 患 病 率 ; 99 了 解 人 体 各 类 生理 生化 指标 的 正常 参考 值 
范围 , 如 各 国 开展 的 儿童 身高 、 体 重 等 发 育 和 营养 状况 的 普查 。 该 种 方式 调查 全 面 , 但 相对 费 
时 、 费 力 , 质 控 较 难 。 

2. 抽样 调查 (sampling survey) 简称 抽查 , 是 指 在 特定 时 间 从 特定 范围 内 的 全 体 成 员 ( 总 
体 ) 中 抽取 具有 代表 性 的 部 分 成 员 进 行 的 调查 。 

抽样 的 基本 原则 是 随机 抽样 ( random sampling )。 在 实际 工作 中 常用 的 随机 抽样 方法 有 下 列 
几 种 : 

(1 ) 单纯 随机 抽样 (simple random sampling): 又 称 简 单 随机 抽样 ， 是 指 从 总 体 中 抽取 了 若干 
个 体 ,构成 一 个 样本 。 抽 样 过 程 中 不 附加 任何 限定 条 件 , 在 抽样 前 未 进行 分 层 或 其 他 方式 处 理 ， 
保证 总 体 中 的 每 个 个 体 被 抽 到 的 机 会 相等 。 抽 样 的 基本 方法 是 使 用 随机 数字 表 法 或 计算 机 随 
机 数字 方法 。 单 纯 随机 抽样 是 比较 简单 而 可 靠 的 随机 化 方法 ,但 在 总 体 与 样本 都 比较 大 时 , 编 
制 名单 、 号 码 、 卡 片 或 抽样 都 会 耗费 大 量 的 人 力 、 物 力 。 同 时 入 选 个 体 车 散在 分 布 于 一 个 地 域 
广 卖 的 地 区 内 , 调查 难度 将 大 大 增加 。 因 此 调查 中 很 少 单独 使 用 简单 随机 抽样 法 , 往往 将 其 作 
为 其 他 抽样 方法 的 基础 。 

(2) 整 群 抽样 (cluster sampling): 是 以 多 个 个 体 组 成 的 群 组 为 单位 而 进行 的 随机 抽样 ,对 被 
抽 中 单位 内 的 每 个 成 员 都 进行 调查 。 这 种 抽样 和 调查 都 比较 方便 , 特别 适合 于 大 范围 的 横断 面 
调查 研究 。 其 优点 是 便于 组 织 .节约 人 力 和 物力 , 在 实际 工作 中 易 被 群众 接受 ; 缺点 是 抽样 误 
差 较 大 , 分 析 工 作 量 也 较 大 。 

(3 ) 分 层 抽样 (stratified sampling ): 为 了 保证 调查 对 象 的 同 质 性 , 可 以 按 主要 影响 因素 如 年 
龄 .性 别 和 职业 等 先 分 成 若干 层 , 大 型 断面 调查 则 可 按 行 政 单位 或 地 区 分 层 。 各 层 内 再 作 简 单 
随机 抽样 。 该 法 的 优点 是 分 层 后 , 层 内 各 单元 的 特征 比较 齐 同 , 变异 较 小 , 精确 度 提高 , 从 而 有 
利于 节省 样本 量 。 

(4) 系统 抽样 (systematic sampling): 系统 抽样 是 指 按照 一 定 的 顺序 , 每 隔 若 干 单位 机 械 地 抽 
取 一 个 单位 的 抽样 方法 ,又 称 机 械 抽 样 。 优 点 是 简便 易 行 .样本 的 观察 单位 在 总 体 中 分 布 均匀 ， 
抽样 的 代表 性 较 好 , 抽样 误差 接近 甚至 略 小 于 单纯 随机 抽样 法 。 缺 点 是 如 果 总 体 各 单元 的 排列 
顺序 有 周期 性 规律 ,抽取 的 样本 可 能 存在 偏 倚 
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(5) 多 阶段 抽样 (multi-stage sampling): 是 指 从 总 体 中 先 抽取 范围 较 大 的 单元 , 一 般 称 为 一 级 
抽样 单元 (例如 省 和 市 等 )， 再 从 抽 中 的 一 级 单元 中 抽取 范围 较 小 的 二 级 单元 (如 县 和 乡 等 )…… 
依 此 类 推 ,最 后 抽取 其 中 范围 更 小 的 单元 (如 社区 行政 村 ) 作 为 调查 对 象 

在 实际 的 调查 工作 中 , 普查 与 抽查 往往 是 相对 的 , 如 整 群 抽样 时 , 在 被 抽 中 的 基层 单位 内 
实际 上 是 进行 普查 , 但 在 总 体 看 来 却 是 抽查 。 在 规模 较 大 的 横断 面 调查 中 , 各 种 抽样 方法 党 


常 结合 运用 。 








三 .实施 方案 

模 断 面 研究 的 规模 一 般 都 比较 大 , 涉及 的 调查 人 员 和 调查 对 象 也 较 多 , 因此 有 一 个 良好 的 
设计 实施 方案 是 保证 研究 成 功 的 前 提 。 

(一 ) 研究 对 象 的 选择 - 

基于 研究 目的 , 对 调查 对 象 的 特点 和 范围 进行 界定 , 同时 还 要 结合 实际 情况 , 考虑 在 目标 
人 群 中 开展 普查 或 抽样 调查 的 可 行 性 。 在 设计 时 可 以 将 研究 对 象 规定 为 某 个 社区 或 乡镇 内 的 
全 体 居 民 或 其 中 的 一 部 分 , 如 儿童 , 即 选择 该 社区 内 <14 岁 者 。 

(二 ) 样本 量 的 估计 

样本 的 大 小 与 抽样 的 方法 有 关 。 简 单 随机 抽样 的 样本 量 的 大 小 与 预期 患 病 率 和 调查 的 精 
确 度 要 求 有 关 。 预 期 的 患 病 率 ( 忆 ) 或 感染 率 高 , 样本 量 则 可 以 小 一 些 ; 要 求 的 精确 度 高 , 则 样本 
量 六 。 精确 度 又 与 容许 误差 (Z) 和 显著 性 水 平 (x) 有 关 。 其 样本 量 的 大 小 可 以 用 下 列 公式 进行 
计算 : 








n=K* OP 

式 中 ”为 样本 量 , P 为 预期 患 病 率 , O=1-P,k 为 系数 。 在 a=0.05 水 平 上 , 当 容许 误差 4 
为 0.1P 时 ,K=400; 当 容许 误差 为 0.15P 时 , K=178; 当 容 许 误差 为 0.20P 时 ,K=100。 

(三 ) 资料 的 收集 

所 收集 的 资料 信息 因 研 究 目 的 的 不 同 而 有 所 差异 , 通常 主要 包括 : 个 人 基本 情况 (如 年 龄 、 
性 别 、 文 化 程度 籍贯 .职业 及 所 在 单位 等 ). 人 口 学 资料 .生活 习惯 、 环 境 资料 等 。 相 关 资 料 一 
般 可 从 临床 和 实验 室 检查 、 调查 询问 和 常规 资料 记录 中 获得 。 


四 、 资 料 的 整理 与 分 析 

在 进行 资料 的 整理 和 分 析 时 ,要 根据 不 同 的 研究 目的 , 选用 不 同 的 指标 。 除 暴露 因素 外 ， 
和 或 事件 的 频率 描述 常见 的 有 : 患 病 率 .抗体 阳性 率 .抗原 或 病毒 携带 率 、 疾 病 诊治 率 、 疫 
苗 接种 率 . 伤 残 率 等 。 

患 病 率 ( prevalence ), 可 按 调查 时 间 的 长 短 分 成 时 点 患 病 率 (point prevalence ) 与 期 间 患 病 率 
(period prevalence )。 时 点 患 病 率 的 时 间 常 指 某 一 天 (如 12 月 31 日 ) 或 更 短 时 间 ; 期 间 患 病 率 则 
可 以 比较 长 周 、 月 甚至 更 长 些 。 调 查 的 病例 数 ( 即 计算 患 病 率 时 的 分 子 ), 应 包括 调查 时 点 或 
期 间 内 ,新 发 生 的 、 正 在 患 病 的 , 以 及 在 此 期 间 内 发 病 后 病故 的 全 部 病例 。 

个 同 地 区 间 患 病 率 进行 比较 时 , 常 采 用 率 的 标 化 方法 。 而 相关 影响 因素 的 分 析 可 采用 单 因 
素 和 多 因素 统计 分 析 模 型 来 完成 




















五 .应 用 范围 
1. 描述 疾病 的 分 布 通过 计算 和 比较 所 获得 的 串 病 率 与 感染 率 等 指标 , 描述 目标 人 群 疾 
病 的 年龄 .性别 、 种 族 、 地 区 等 的 分 布 状 况 ， 从 而 为 制定 防治 对 策 提供 参考 依据 。 本 
2. 提出 病因 线索 “可 以 从 疾病 与 研究 对 象 特征 以 及 环境 因素 的 联系 中 研究 疾病 分 布 的 不 
同 影响 因素 , 从 而 提出 病因 线索 
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3. 确定 高 危 人 群 ”通过 筛 查 , 可 以 检 出 患者 .可疑 患者 和 病原 携带 者 , 从 而 确定 高 危 人 群 ， 
达到 早 发 现 、 早 诊断 和 早 治疗 的 目的 , 提高 疾病 诊治 效果 。 

4. 评价 防治 效果 ”在 疾病 监测 、 预 防 接 种 的 实施 过 程 中 , 通过 不 同 阶段 开展 重复 的 横断 面 
调查 , 比较 患 病 率 、 感 染 率 等 相关 指标 的 差异 , 评价 防治 方案 的 确切 效果 。 

5. 医疗 卫生 服务 的 需求 与 质量 评价 ”通过 横断 面 调查 可 以 评价 社区 卫生 服务 的 近期 和 远 
期 效果 。 近 期 效果 如 体检 率 、 家 庭 和 个 人 健康 档案 建 档 率 、 疫 苗 接种 率 、 居 民 卫 生 知 识 知晓 率 
等 。 远 期 效果 如 发 病 率 下 降 、 死 亡 率 下 降 、 人 均 期 望 寿命 延长 和 医疗 费用 下 降 等 。 


六 、 优 缺 点 


1. 优点 ”容易 实施 ,科学 性 较 强 , 研究 对 象 代表 性 好 , 一 次 研究 可 观察 多 种 疾病 (事件 ) 的 
患 病状 况 及 多 种 相关 的 可 能 影响 因素 。 

2. 缺点 “一 次 横断 面 调查 难以 确定 暴露 与 疾病 之 间 的 因果 关系 , 尤其 是 在 开展 大 规模 调查 
时 , 需 投 入 很 多 人 力 、 物 力 。 





( 闫 永 平 ) 


第 七 节 病例 分 析 


病例 分 析 ( case analysis ) 是 临床 医生 最 为 熟悉 和 常用 的 一 种 研究 方法 。 可 为 医疗 实践 提供 
最 基本 的 信息 , 发 现 临 床 试验 中 容易 忽略 的 问题 , 产生 新 的 研究 思路 , 更 好 地 服务 于 患者 。 病 
例 分 析 往往 反映 研究 者 临床 经 验 的 积累 水 平 、 对 当前 学 科 发 展 方向 的 把 握 以 及 对 相关 领域 研究 
结果 的 关注 度 。 




















一 .概述 
(一 ) 概念 
病例 分 析 是 对 现 有 的 临床 资料 进行 归纳 、 分 析 并 得 出 结论 , 或 对 某 些 临床 新 出 现 的 疾病 病 
因 或 表现 特征 进行 描述 、 分 析 、 总 结 的 一 类 研究 。 主 要 包括 个 案 病 例 报告 和 系列 病例 分 析 等 ， 
成 为 临床 医生 日 常 工作 中 使 用 最 广泛 ,也 最 易 掌握 的 一 种 描述 性 研究 方法 。 





(二 ) 特点 
1. 以 观察 法 为 主要 研究 手段 , 主要 通过 观察 .收集 和 分 析 相关 病例 数据 , 归纳 和 总 结 研究 
对 象 的 基本 特征 。 


2. 由 于 不 设立 对 照 组 , 仅 能 提供 因素 与 事件 之 间 的 因果 联系 线索 , 但 可 为 后 续 分 析 性 研究 

打下 基础 。 
二 .设计 模式 

(一 ) 个 案 病例 报告 
个 案 病例 报告 (case report ) 是 对 单个 或 少数 几 个 病例 的 个 人 基本 信息 、 临 床 和 流行 病 学 特 
征 的 描述 .分析 和 总 结 。 尤 其 在 罕见 和 新 发 疾病 的 报道 中 最 为 有 用 ,常常 为 发 现 新 病 种 或 药物 
副作用 等 提供 第 一 手 资料 。 

(二 ) 系列 病例 分 析 

系列 病例 分 析 ( case series ) 是 对 一 系列 或 一 组 病例 的 人 口 学 特征 、 临床 和 流行 病 学 特征 的 
描述 、 分析 和 总 结 。 在 设计 时 一 般 采 用 以 下 2 种 模式 : 

1. 连续 系列 病例 分 析 ( consecutive case series) 就 是 将 研究 期 间 内 所 有 符合 条 件 的 病例 均 
纳入 分 析 。 
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2 非 连续 系列 病例 分 析 ( nonconsecutive case series ) 就 是 将 研究 期 间 内 部 分 符合 条 件 的 病 

例 纳入 分 析 。 一 般 采 用 随机 抽样 方法 选择 这 部 分 病例 , 作为 总 体 病例 的 代表 。 
三 .实施 方案 

实施 病例 分 析 时 , 首先 是 要 根据 临床 观察 和 资料 报道 提出 拟 分 析 的 问题 , 进一步 查阅 、 了 
解 与 该 问题 相关 的 文献 , 阅读 相关 的 病历 记录 , 制订 调查 和 随访 内 容 , 然后 确定 病例 范围 和 研 
究 期 限 , 明确 纳入 和 排除 标准 , 以 保证 结论 的 可 靠 性 。 

(一 ) 研究 对 象 的 选择 

病例 系列 或 一 组 病例 往往 选择 接受 同样 的 治疗 方案 者 , 以 便 分 析 疗 效 和 药物 副作用 等 ; 或 
者 选择 疾病 诊断 相同 的 病例 用 以 分 析 不 同方 案 的 疗效 及 其 影响 因素 等 。 

(二 ) 样本 量 的 估计 

系列 病例 分 析 样本 量 原则 上 是 越 多 越 有 说 服 力 。 但 要 注意 的 是 如 果 样 本 量 过 大 时 , 要 注意 
控制 好 系统 误差 。 

(三 ) 资料 的 收集 

需要 收集 详细 的 人 口 学 特征 ( 如 年 龄 .性 别 、 种 族 等 )、 主诉、 证 状 、 体 征 、 体 格 和 实验 室 检 
查 、 既 往 史 、 家 族 史 、 诊 断 、 治 疗 .药物 反应 和 随访 等 重要 信息 。 除 病历 和 随访 记录 外 , 还 可 以 设 
计 简 要 的 调查 表 收 集资 料 , 对 记录 不 清楚 、 项 目 不 完 整 者 进行 补充 调查 。 

四 、 资 料 的 整理 与 分 析 

一 方面 , 可 以 观察 干预 措施 对 疾病 的 治疗 效果 和 药物 副作用 等 。 例 如 , 接受 化 疗 的 恶性 肿 
瘤 病 人 , 观察 其 化 疗 的 不 良 反 应 或 并 发 症 的 发 生 率 ,发 生 的 时 间 、 严 重 程度 和 恢复 的 时 间 等 ; 另 
一 方面 ,还 可 从 已 获得 结果 中 分 析 和 总 结 出 可 能 的 病因 或 干预 效果 。 例 如 在 肺癌 患者 中 , 调查 
吸烟 的 历史 。 从 高 血压 患者 并 发 症 分 析 中 评价 降 压 药 的 作用 和 效果 等 。 另 外 , 还 可 基于 病例 分 
析 的 具体 目的 进行 相应 地 分 析 和 总 结 , 重点 是 探讨 研究 中 的 新 发 现 以 及 对 临床 实践 的 应 用 价值 。 

结果 分 析 中 , 计数 资料 常 采用 率 表示 , 计量 资料 则 用 均 数 二 标准 差 表示 。 并 以 95% 可 信 区 
间 来 表示 结果 的 精度 。 

五 .应 用 范围 

病例 分 析 在 临床 上 应 用 最 为 广泛 , 几乎 涉及 临床 的 方方面面 。 如 描述 罕见 或 新 发 现 疾病 的 
临床 特征 、 诊 治 方法 和 预后 , 描述 新 的 手术 方式 和 医疗 革新 , 描述 危及 患者 生命 、 罕 发 的 药物 副 
作用 ,报告 医疗 事故 、 差 错 和 经 验 教训 , 总 结 临床 治疗 和 护理 经 验 等 。 

个 案 病 例 报告 主要 描述 一 种 新 的 疾病 或 综合 征 。 一 些 疾病 就 是 通过 病例 报告 而 为 人 所 知 ， 
如 多 发 性 骨 骨 瘤 的 发 现 。 当 一 定数 量 的 个 案 汇集 到 一 篇 文章 中 , 就 被 称 为 系列 病例 分 析 , 可 及 
早 发 现 疾病 流行 的 端倪 , 了 解 药物 的 不 良 反 应 , 如 1981 年 洛杉矶 发 现 多 个 艾滋 病 串 者。 倘若 个 
案 病例 还 可 以 简单 地 归 为 偶然 事件 , 但 系列 病例 发 生 时 就 需要 考虑 深层 次 的 原因 。 如 , 乳房 硅 
胶 植 人 与 系统 性 红斑 狼疮 的 可 能 联系 。 但 这 只 能 是 线索 , 如 果 不 做 进一步 检验 和 验证 , 往往 会 
出 现 误 判 。 

实例 ; 2003 年 10 月 4 中华 结 核 和 呼吸 杂志 》 报 道 了 世界 首 例 严重 急性 呼吸 综合 征 (SARS ) 的 
病例 报告 ,引起 广泛 关注 。 作 者 在 该 文中 详细 描述 了 该 例 病人 的 一 般 特征 和 诊治 过 程 。 患 者 为 
男性 ,43 岁 , 既往 体 健 , 广东 省 佛山 市 人 , 于 2002 年 11 月 16 日 开始 出 现 不 明 原因 的 持续 发 热 








| (>39% ) 伴 腹泻, 咳嗽 ,无 疾 , 无 鼻塞 、 流 涕 ,无 皮疹 和 肌肉 酸痛 。 在 当地 一 诊所 查 血 : 白细胞 计 





气管 肺炎 ”, 使 用 


| 


数 (WBC) 为 3.4x 107L; 胸部 X 线 : 双 肺 纹理 明显 增强 , 以 碳 肺 明显 ; 拟 诊 ” 支 
二 .三 代 头 移 菌 素 和 三 唑 巴 坦 加 用 哌 拉 西 林 等 治疗 无 效 。11 月 25 日 转 至 佛山 市 
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胸部 X 线 示 双 肺 弥 漫 浸润 。 经 过 吸 氧 静脉 注射 头孢 他 喧 和 环 丙 沙 星 等 治疗 ,至 11 月 28 日 ， 
体温 降 至 正常 范围 , 腹泻 控制 ,但 呼吸 困难 等 症状 加 重 , 动脉 血气 分 析 提示 严重 低 氧 血 症 , 拟 诊 
“急性 呼吸 窘迫 综合 征 (ARDS), TI 型 呼吸 衰竭 " 转 人 ICU。11 月 29 日 出 现 肝 功 能 不 全 等 多 脏 器 
功能 不 全 综合 征 ( MODS), 胸部 X 线 示 双 肺 渗 出 明显 , 经 过 气管 插 管 、 机 械 通 气 、 抗 病毒 .抗生素 
和 糖 皮质 激素 加 用 分 子 吸附 再 循环 系统 (MARS ) 等 治疗 19 天 , 病情 逐渐 好 转 , 2003 年 1 月 8 日 
治愈 出 院 , 但 双 肺 阴 影 仍 未 完全 消退 , 直至 出 院 第 49 天 双 肺 阴影 完全 消退 , 肺 纹理 转 为 清晰 。 
该 病例 报告 为 国内 外 SARS 防治 研究 提供 了 宝贵 的 第 一 手 资料 。 其 实在 整个 SARS 发 现 和 防治 
过 程 中 , 从 首 例 的 个 案 报道 .系列 病例 分 布 特征 、 实 验 室 检查 和 治疗 经 过 等 的 描述 , 到 分 离 出 新 
型 冠状 病毒 , 最 终 对 疫苗 的 研制 和 激素 等 的 综合 治疗 , 可 以 清楚 地 看 到 , 一 种 未 知 原因 的 疾病 
的 研究 , 常常 是 以 个 案 报 道 及 系列 病例 分 析 为 起 点 的 , 因此 , 病例 分 析 仍 然 是 临床 研究 不 可 或 
缺 的 设计 方案 。 但 是 它 的 偏 倚 也 是 无 法 克服 的 , 如 该 首 例 SARS 病例 到 底 有 无 传染 性 ? 病因 是 
什么 ?诊断 标准 如 何 制 定 ? 治愈 究竟 是 哪 种 或 哪 几 种 药物 和 治疗 手段 发 挥 了 作用 呢 ? 抑或 是 
自 愈 ? 等 等 。 这 些 问题 都 需要 进一步 采用 分 析 性 和 实验 性 研究 方法 来 解决 。 


六 、 优 缺 点 


1. 优点 ”研究 容易 实施 , 节省 人 力 、 物 力 , 短期 易 出 结果 , 常 作 为 很 多 临床 分 析 性 研究 和 
实验 性 研究 的 基础 。 在 个 别 情况 下 , 设 对 照 组 可 能 没有 必要 , 系列 病例 报告 就 能 很 好 说 明 问题 。 
例如 , 如 果 调 查 出 生 1 个 月 内 婴儿 死亡 的 原因 时 发 现 有 很 多 婴 幼儿 是 由 于 头 部 跌落 在 地 板 上 所 
致 , 此 时 再 设置 对 照 组 开展 分 析 和 实验 性 研究 就 显得 没有 必要 , 而 且 与 伦理 学 相悖 。 再 比如 ， 
使 用 链 霉 素 治疗 结核 性 脑膜 炎 , 不 治疗 是 致命 的 , 那么 存活 率 的 普遍 提高 就 是 显著 的 效果 。 

2. 缺点 ， 没 有 对 照 组 , 大 多 情况 下 研究 结果 的 说 服 力 不 强 。 不 能 控制 选择 偏 倚 和 混杂 因 
素 对 结果 的 影响 , 研究 结果 的 论证 强度 弱 , 重复 性 较 差 。 




















〈 国 永 平 ) 
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哈佛 大 学 医学 院 院 长 Sydney Burwell 博士 曾 说 过 :“ 医 学 生 在 学 校 接 受 的 知识 , 10 年 后 其 中 
一 半 可 能 是 错误 的 , 而 可 悲 的 是 没有 人 能 预测 哪 一 半 是 错误 的 。" 因 此, 为 了 不 被 过 时 、 错 误 的 
知识 所 误导 , 需要 针对 临床 工作 中 遇 到 的 问题 , 不 断 查寻 新 的 文献 资料 , 掌握 学 科 发 展 的 历史 、 
现状 和 把 握 未 来 发 展 方向 , 更 新 知识 结构 。 而 繁忙 的 临床 医师 如 何在 众多 的 医学 刊物 和 数据 库 
中 快速 有效 地 查寻 相关 领域 的 最 佳 信息 , 无 疑 是 一 种 挑战 。 





第 一 节 ” 循 证 医学 的 证 据 资源 


临床 医生 面临 临床 问题 时 常 查寻 的 信息 资源 包括 教科 书 、 专 著 、 中 国生 物 医 学 文献 数据 库 、 
MEDLINE 等 或 咨询 专家 。 然 而 , 全 世界 有 为 数 众多 的 医学 文献 数据 库 , 每 个 专业 或 亚 专业 又 有 
其 独特 的 数据 库 资源 或 检索 工具 ,同时 并 不 是 每 个 数据 库 提供 的 信息 资源 都 是 真实 、 可 靠 且 能 
方便 、 快 捷 地 获取 的 。 





一 、 循 证 医学 的 证 据 资源 及 其 发 展 

循 证 医学 的 证 据 资源 经 历 了 漫长 的 发 展 过 程 。20 世纪 90 年 代 前 , 临床 医生 主要 依靠 手工 
检索 工具 和 光盘 先 获取 题 录 , 再 查阅 全 文 。 这 种 方式 耗 时 上 且 不 一 定 能 获得 最 新 证 据 信息 。 随 着 
计算 机 和 网 络 技术 发 展 , 信息 的 储存 、 传 输 和 利用 进入 了 一 个 轨 新 的 阶段 。 人 们 逐步 摆脱 对 耗 
时 、 费 力 、 检 索 效果 差 的 手工 检索 依赖 , 转 而 采用 快速 高效 的 联机 检索 , 既 克 服 了 时 空 障碍 , 又 
极 大 提高 了 获得 最 新 信息 的 能 力 。 大 存 贮 量 的 光盘 和 联机 检索 极 大 地 降低 了 计算 机 检索 的 费 
用 ,使 及 时 、 准 确 、 全 面 利用 人 类 研究 成 果 , 成 为 可 能 。 在 此 基础 上 , 一 些 信息 专家 、 方 法 学 家 
和 临床 专家 们 开始 考虑 如 何 从 浩如烟海 的 信息 资源 中 去 粗 取 精 .去 伪 存 真 , 为 繁忙 的 临床 医生 
提取 真实 、 可 靠 且 有 临床 实用 价值 的 信息 , 这 些 资源 包括 1991 年 创刊 的 美国 内 科 医 师 学 会 杂志 
俱乐部 (ACP Journal Club )、1993 年 Iain Chalmers 等 创立 Cochrane 协作 网 和 建立 Cochrane 图 书 
馆 、1999 年 BMJ 推出 的 Clinical Evidence, 越 来 越 多 的 循 证 医学 信息 资源 可 供 临床 医生 选择 。 这 
些 资源 或 从 方法 学 质量 和 临床 价值 方面 严格 评估 原始 临床 研究 , 或 采用 系统 评价 和 meta 分 析 
方法 整合 针对 同一 临床 问题 的 高 质量 原始 研究 , 或 针对 临床 主题 总 结 治疗 某 一 种 疾病 的 所 有 证 
据 , 帮助 临床 医生 明确 哪些 干预 措施 有 效 、 哪 些 无 效 甚 至 有 害 , 极 大 方便 了 临床 医生 开展 循 证 
临床 实践 。 随 后 , 各 大 医学 信息 数据 库 提供 商 相继 推出 PIER( Physician’s Information Education 
and Resources )、DynaMed ,UpToDate 等 数据 库 , 集 多 种 高 质量 资源 于 一 体 , 在 总 结 证 据 基 础 上 ， 
结合 专家 经 验 、 患 者 价值 观 给 出 推荐 意见 , 进而 基于 证 据 的 质量 给 出 推荐 强度 。 至 此 , 临床 医 
生 不 再 需要 自己 花费 大 量 时 间 从 PupMed 、Embase 等 原始 文献 数据 库 中 去 检索 、 获 取 全 文 .评价 
和 总 结 临床 研究 证 据 。 这 类 资源 的 不 断 丰 富 和 发 展 , 使 实践 循 证 医学 成 为 可 能 。 

国内 目前 还 没有 类 似 的 中 文 数据 资源 , 使 用 这 些 英文 的 资源 , 国内 医生 将 面临 语言 .医疗 
环境 差异 和 费用 等 难题 。 











二 、 循 证 医学 证 据 资 源 分 类 
Haynes 等 于 2001 年 .2006 年 和 2009 年 分 别提 出 了 循 证 医学 资源 的 “4S”" “5S” 和 “6S" 模 
型 , 细 化 了 证 据 资源 的 分 类 , 为 不 同 用 户 提 供 更 新 、 更 实用 日 经 过 筛选 的 循 证 医学 证 据 。“6S” 
68 
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模型 将 信息 资源 分 为 6 类, 即 系统 类 (system)、 集 成 类 (summaries)、 系 统 评价 摘要 类 ( synopses 
of syntheses )、 系 统 评价 类 (syntheses)、 原 始 研 究 摘要 类 (synopses of studies ) 和 原始 研究 类 
(studies )。 

1. 系统 类 ” 即 计 算 机 决策 支持 系统 (computerized decision support system, CDSS ), 是 指针 对 
某 个 临床 问题 , 概况 总 结 所 有 相关 和 重要 的 研究 证 据 , 并 通过 电子 病例 系统 与 特定 患者 的 情况 
自动 联系 起 来 , 为 医生 提供 决策 信息 。 现 有 的 数据 库 尚 不 能 达到 如 此 高 智能 化 程度 。 即 使 有 ， 
证 据 系统 本 身 也 不 能 直接 告诉 医生 如 何 治疗 患者 , 需要 临床 医生 根据 经 验 和 专业 知识 将 证 据 与 
患者 的 具体 情况 和 期 望 整合 进行 决策 。 

2. 集成 类 ”针对 临床 问题 总 结 研究 证 据 , 但 不 与 具体 病案 链接 的 循 证 医学 数据 库 资源 , 包 
括 针对 具体 临床 疾病 的 临床 路 径 、 不 断 更 新 的 网 络 版 教材 以 及 循 证 临床 实践 指南 等 , 这 类 资源 
有 : Clinical Evidence( http://www.clinicalevidence.com)、 由 美国 医师 学 院 提 供 的 PIER( Physician’s 
Information and Education Resource, http://pier.acponline.org/index.html )、 Dynamed( www.ebscohost. 
com/dynamed )、 UpToDate( http://www.uptodate.com)、 ACP Medicine(www.acpmedicine.com )、ACS 
Surgery (www.acssurgery.com )、 Harrison’s Practice( www.harrisonspractice.com/practice/ub )、First 
Consult( www.mdconsult.com/php/142221516-2/homepage )、 eTherapeutics( www.e-therapeutics.ca )、 
National Guidelines Clearinghouse( www.guidelines.gov )、 Registered Nurses’ Association of Ontario 
(www.rnao.org ) 等 。 

3. 系统 评价 摘要 类 ”精心 编辑 的 结构 式 摘要 ,通常 仅 1 页 , 由 方法 学 家 和 临床 专家 从 发 表 
的 系统 评价 中 筛选 出 的 临床 相关 且 有 重要 临床 价值 的 高 质量 证 据 , 主要 发 表 在 美国 内 科 医 师 学 
会 杂志 俱乐部 (American College of Physician Journal Club, ACP Journal Club, http://www.acpjc.org )、 
Evidence-Based Mental Health( htip://ebmh.bmj.com), Evidence-Based Nursing( http://ebn.bmj.com ) 
和 系统 评价 摘要 库 ( DARE, the Database of 4Abstracts of Reviews of Evidence, www.crd.york.ac.uk/ 
crdweb ) 等 。 

4. 系统 评价 类 ”系统 评价 是 针对 某 一 具体 临床 问题 (如 疾病 的 病因 、 诊 断 、 治 疗 、 预 后 )， 
系统 、 全 面 收集 全 世界 所 有 已 发 表 或 未 发 表 的 临床 研究 , 严格 评价 纳入 文献 的 偏 倚 风 险 , 筛选 
出 符合 质量 标准 的 文献 ,进行 定性 或 定量 合成 (meta analysis, 荟萃 分 析 ), 得 出 可 靠 的 综合 结论 。 
相对 于 单个 原始 临床 研究 , 系统 评价 对 精力 、 时 间 有 限 的 临床 医生 来 说 更 实用 。 系 统 评价 分 
为 Cochrane 系统 评价 和 非 Cochrane 系统 评价 , 前 者 由 Cochrane 协作 网 (hitp://www.cochrane.org/ 
index.htm ) 的 作者 制作 并 发 表 在 Cochrane 图 书馆 , 古 全 世界 系统 评价 的 30%~40%, 后 者 发 表 在 
杂志 上 。 相 关 数 据 库 EvidenceUpdates(http:/plus.mcmaster.ca/EvidenceUpdates )。 

5. 原始 研究 摘要 类 ”由 方法 学 家 和 临床 专家 对 主要 医学 期 刊 上 发 表 的 原始 研究 从 方法 学 
和 临床 重要 性 两 方面 评价 , 筛选 出 高 质量 论著 以 结构 摘要 的 形式 再 次 出 版 , 并 附 专家 推荐 意见 。 
如 美国 内 科 医 师 学 院 杂 志 俱 乐 部 (American College of Physician Journal Club, ACP Journal Club, 
http://www.acpjc.org ) 和 InfoPOEMSs( http:/www.infopoems.comy/)。 

6. 原始 研究 类 ”发表 在 杂志 和 综合 文献 数据 库 、 未 经 专家 评估 的 文献 资料 如 MEDLINE、 
Embase 中 文 数据 库 (CBM、CNKI、CMCC、VIP) 等 。 临 床 医生 在 检索 和 应 用 此 类 文献 时 , 需 交 自 
己 进行 评估 研究 结果 的 真实 性 、 临 床 重要 性 和 适用 性 后 方 可 应 用 , 否则 可 能 误导 。 

三 、 证 据 资源 的 入 选 标 准 

针对 某 一 临床 问题 ,要 快捷 、 高 效 检索 到 相关 信息 , 正确 选择 信息 资源 或 数据 库 十 分 重要 。 
如 何 选择 信息 资源 呢 ? MeKibbon 等 列 出 了 4 条 标准 ( 表 5-1). 

1. 循 证 方法 的 严谨 性 ” 循 证 医学 信息 资源 需要 针对 临床 问题 提供 具有 代表 性 的 高 质量 证 
据 。 在 总 结 证 据 资 源 时 , 应 精心 构建 临床 问题 .系统 全 面 检索 相关 证 据 、 严 格 评 价 单个 研究 的 
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表 5-1 选择 或 评估 信息 资源 的 标准 








选择 标准 标准 内 容 描述 
1. 循 证 方法 的 严谨 性 Y 推论 是 否 严格 遵循 证 据 
提出 推荐 意见 时 是 否 给 出 支持 其 结论 的 证 据 强度 
是 否 为 读者 提供 了 证 据 链 接 以 方便 阅读 
2. 内 容 的 全 面 性 和 特异 性 。 “v 是 否 充分 覆盖 了 我 的 专业 领域 或 内 容 范围 


” 是 否 覆 盖 了 我 提出 的 问题 类 型 (治疗 ,诊断 、 预 后、 病因 或 不 良 反应 ) 
Y 是 否 针对 我 临床 实践 的 具体 专业 领域 


3. 易 用 性 Y 能 否 快 速 、 始 终 如 一 地 提供 我 需要 的 信息 
4. 可 及 性 ” 是 否 在 我 需要 使 用 的 任何 场所 均 能 方便 获取 


Y 是 否 能 支付 其 费用 
EA 


真实 性 、 恰 当 总 结 和 合成 结果 。 循 证 医学 信息 资源 在 提出 推荐 意见 时 要 充分 应 用 已 有 的 系统 评 
价 或 自己 制作 系统 评价 , 针对 患者 重要 的 结局 指标 (patient-important outcomes), 为 不 同 干预 措施 
的 疗效 和 安全 性 提供 最 佳 估计 , 并 在 充分 考虑 患者 的 价值 观 和 选择 基础 上 , 采用 恰当 的 分 级 系 
统 对 推荐 意见 进行 分 级 。 _ 

2. 内 容 的 全 面 性 和 特异 性 ”理想 的 循 证 医学 信息 资源 应 该 为 临床 实践 中 可 能 遇 到 的 所 有 
问题 提供 相关 证 据 。 但 针对 某 一 专业 领域 的 信息 资源 可 能 会 更 有 效 地 帮助 查寻 需要 的 证 据 。 
如 要 紧 跟 某 些 临 床 专业 的 最 新 进展 , 可 查寻 某 些 循 证 的 摘要 如 Evidence-based Cardiovascular 
Medicine, Evidence-based Mental Health 和 Evidence-based Oncology 等 。 

某 些 信息 资源 是 专门 针对 某 一 类 临床 问题 , 如 Clinical Evidence 和 Cochrane 系统 评价 数据 
库 目前 仅 涉及 治疗 性 临床 问题 , 且 后 者 仅 包括 临床 对 照 试验 的 系统 评价 。 

3. 易 用 性 某 些 信息 资源 查寻 起 来 方便 快捷 ,如 美国 内 科 医 师 学 会 杂志 俱乐部 (ACP Journal 
Club ) 为 小 型 数据 库 , 收集 了 内 科 领 域 约 140 种 杂志 上 发 表 的 与 临床 最 相关 的 高 质量 研究 的 摘 
要 ,其 优秀 的 检索 引 警 确保 读者 能 很 容易 查寻 到 任何 该 领域 的 信息 , 包括 疾病 病因 ,诊断 、 治 疗 
和 预后 等 。 

MEDLINE 是 检索 世界 生物 医学 文献 资源 最 主要 的 数据 库 之 一 , MEDLINE 的 检索 可 采用 联 
机 检索 ,光盘 检索 , 近年 来 由 于 计算 机 国际 互联 网 (INTERNET ) 的 应 用 , 90% 的 国际 联机 检索 系 
统 都 已 进入 INTERNET。 通过 隶属 美国 国立 医学 图 书馆 的 国家 生物 技术 中 心 开 发 的 INTERNET 
免费 PubMed( http://www.ncbi.nlm.nih.govpubmed/) 网 络 检索 系统 ， 可 检索 MEDLINE 数据 库 及 
Pre-Medline 数据 库 。 数 据 库容 量 庞大 , 2008 年 初 已 包含 约 1700 万 篇 文献 , 每 年 以 70 万 条 速度 
增加 , 其 检索 速度 较 慢 。PubMed 是 检索 MEDLINE 较 容易 的 途径 , 其 专门 为 临床 医生 设计 的 
“Clinical Queries” 检索 方式 可 将 检索 结果 最 大 限度 地 局 限于 与 临床 决策 相关 的 文献 资料 。 

Cochrane 系统 评价 尽管 容易 检索 , 但 每 一 篇 系统 评价 包括 内 容 较 多 、 统 计 分 析 结 果 较 复杂 、 
报告 质量 各 异 , 临床 医生 需要 花 很 多 时 间 阅 读 和 理解 方 可 应 用 于 临床 。 | 

4 可 及 性 最 可 靠 和 最 有 效 的 信息 资源 往往 需要 付费 目 价格 比较 昂贵 。 临 床 医生 通常 利 
用 所 在 医院 或 医学 院 校 图 书馆 免费 检索 网 上 资源 ,个 人 大 多 不 会 订阅 昂贵 的 期 刊 杂 志 或 数据 库 。 
目前 大 多 可 及 信息 资源 是 免费 的 , 如 中 低 收 入 的 发 展 中 国家 的 临床 医生 可 通过 学 术 机 构 的 网 
络 进 入 世界 卫生 组 织 的 健康 网 络 研 究 启 动 项 目 (Health InterNetwork Access to Research Initiative， 
HINARI) 获 取 免 费 信息 资源 ， 对 于 全 球 免费 开放 的 资源 有 : PubMed, Canadian Medical Association 
Journal( http://www.cmaj.ca ) 和 大 多 数 BioMed Central 的 杂志 ( http://www.biomedcentral.com ), 一 
些 杂志 可 在 其 发 表 6~12 个 月 后 全 部 免费 检索 , 甚至 可 免费 检索 最 新 一 期 的 部 分 文献 , 如 BMJ， 
JAMA 和 Mayo Clinic Proceedings 等 。 
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、 常 用 循 证 医学 证 据 资源 

根据 “6S” 模型 ， 下 面 简单 介绍 常用 的 各 类 数据 库 资源 。 由 于 证 据 系统 是 理想 化 、 高 智能 的 
系统 , 目前 尚 无 循 证 医学 数据 库 能 达到 此 水 平 ， 因此 直接 从 证 据 集成 开始 介绍 。 

(一 ) 证 据 集 成 

1. Clinical Evidence Clinical Evidence( http://www.clinicalevidence.com/ceweb/conditions/ 
index.jsp ) 由 BMJ 出 版 ， 是 世界 上 最 具 权 威 性 的 医学 数据 库 之 一 ， 以 内 科 治 疗 为 主 ,涉及 600 多 
种 疾病 的 3250 多 种 治疗 方法 , 每 年 更 新 一 次 并 在 不 断 拓 展 新 的 题目 和 和 领域 如 疾病 诊断 。 该 数 
据 库 针 对 每 种 疾病 , 严格 评估 每 种 治疗 方法 的 疗效 和 安全 性 ， 告诉 读者 哪些 治疗 方法 有 益 、 哪 
些 可 能 有 益 、 哪 些 利 浆 相当 、 哪 些 不 可 能 有 益 、 哪些 可 能 无 益 甚 至 有 害 和 哪些 疗效 不 确定 等 。 
此 外 ,针对 每 个 主题 采取 列表 的 方式 列 出 最 新 发 表 的 证 据 ， 及 时 更 新 内 容 。 

Clinical Evidence 方便 易 用 , 但 除 其 成 员 和 中 低 收 入 的 发 展 中 国家 外 ， 均 需 付费 。 北 京 大 学 
的 循 证 医学 中 心 曾 将 其 15 版 翻译 为 中 文 《临床 证 据 》 于 2008 年 出 版 ,方便 国内 读者 , 但 存在 及 

. 时 更 新 间 题 。 

2. PIER PIER(Physicians’ Information and Education Resource )( http://pier.acponline.org/ 
index.html) 是 美国 内 科 医 师 学 会 的 产品 。 主 要 包括 : 疾病 、 筛 查 与 预防 、 补 充 / 替代 医学 、 伦 理 
和 法 律 问题 、 流程 质量 测 量 方法 和 药物 信息 。 其 优点 是 采用 多 层次 结构 指导 临床 医生 应 用 研 
究 证 据 , 所 有 问题 均 采 用 同样 结构 , 所 有 推荐 意见 均 与 研究 证 据 紧密 相连 。 基于 严格 的 循 证 医 
学 方法 , 从 精心 构建 问题 、 全 面 收集 所 有 干预 措施 和 以 病人 为 中 心 的 结局 指标 、 评 估 单 个 研究 
的 质量 、 采 用 高 质量 的 分 级 系统 、 到 充分 考虑 患者 的 价值 观 和 选择 等 , 最 终 形成 PIER 推荐 意 
见 。PIER 主要 涉及 内 科 和 初级 保健 方面 的 治疗 问题 , 覆盖 面 有 限 。 

PIER 昌 方 便 易 用 , 但 需要 付费 , PDA 版 本 收费 标准 约 100 美 元 。ACP 注册 成 员 可 免费 。 

3. UpToDate UpToDate( http://www.uptodate.com/index.asp ) 是 一 电子 信息 资源 ， 可 从 网 上 、 
PC 机 和 PDA 获取 , 由 于 其 使 用 方便 、 覆 盖 面 广 和 根据 疾病 分 类 收集 信息 ， 深 受 全 科 医 师 、 专 科 
医师 和 家 庭 医师 青睐 。 类 似 于 PIER, UpToDate 为 临床 医生 提供 推荐 意见 ， 方法 严谨 , 提出 问题 
结构 统一 、 循 证 医学 文献 检索 较为 全 面 , 最 后 采用 GRADE 分 级 评价 证 据 质量 和 提出 推荐 意见 。 
UpToDate 明确 承认 患者 价值 观 和 选择 权 在 临床 决策 中 的 重要 性 。 

UpToDate 覆盖 了 14 个 医学 专业 的 7700 个 临床 主题 , 包括 约 80 000 页 正文 、 图 片 , 并 与 
MEDLINE 摘要 、260 000 条 参考 文献 和 一 个 药物 数据 库 链 接 , 每 4 个 月 更 新 一 次 。 

UpToDate 使 用 方便 , 但 缺乏 规范 检索 ,需要 付费 。 个 人 第 1 年 订购 费 为 450 美元 , 以 后 为 
350 美元 , 图 书馆 订购 为 10000 美 元 。 

4. 临床 实践 指南 ”临床 实践 指南 (clinical practice guideline， CPG ) 是 证 据 强度 很 高 的 信息 
资源 ,有 助 于 指导 临床 决策 。 其 中 ,美国 国家 指南 数据 库 (US National Guidelines Clearinghouse 
Database, NGC, http://www.guideline.gov/ ) 收 集 了 美国 和 全 世界 数 千 个 指南 并 提供 了 2488 个 指南 
的 摘要 (截至 2012 年 12 月 ), 涉及 所 有 主题 , 指南 制订 按照 循 证 医学 原则 和 方法 。NGC 检索 简 
单 ,同时 比较 针对 同一 主题 的 多 个 指南 。 

此 外 ,还 可 在 英 国 国立 卫生 图 书馆 (UK National Library for Health ， http://libraries.nelh.nhs. 
uk/guidelinesFinder/default.asp?page=INTER ) 和 安大略 医学 会 网 站 ( Ontario Medical Association， 
http://www.gacguidelines.ca/ ) 查 寻 到 指南 ,后 者 指南 是 经 过 严格 评估 的 。 

(二 ) 系统 评价 摘要 

1. ACP Journal Club 包括 ACP Journal Club(http://www.acpjc.org/ )、 Evidence-Based Medicine 
杂志 和 系列 以 ACP Journal Club 为 模版 的 杂志 , 以 纸 质 或 网 络 版 发 行 。ACP Journal Club 先 由 工 
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作 人 员 从 130 种 杂志 中 筛选 方法 学 严格 、 涉 及 临床 问题 、 报 告 了 重要 临床 结局 指标 的 高 质量 原 
始 研究 和 系统 评价 , 再 让 临床 医生 从 中 选择 对 临床 有 重要 价值 和 影响 的 文献 , 以 结构 摘要 形式 
进行 总 结 , 并 由 一 名 临床 专家 评估 文献 的 方法 和 提出 临床 应 用 的 建议 。 比 例 大 致 为 150:1, 即 
150 篇 文献 中 可 筛选 出 1 篇 合格 者 。 

ACP Journal Club 由 美国 内 科 医 师 学 会 出 版 , 主要 针对 内 科 及 其 亚 专业 , 也 包括 少量 其 他 专 
业 如 儿科 ,月刊 , 需 付费 ,有 助 于 临床 医生 了 解 内 科 领 域 新 进展 。 

2. Database of Abstracts of Reviews of Evidence( DARE) DARE(http://www.crd.youk.ac.uk/ 
crdweb ) 是 唯一 经 过 质量 评价 的 免费 系统 评价 摘要 库 , 由 英国 约克 大 学 生产 。 每 篇 摘要 包括 对 
系统 评价 的 总 结 和 整体 质量 的 严格 评价 , 对 无 时 间 评 价 或 不 能 获取 系统 评价 全 文 的 临床 医生 非 
常 有 用 。DARE 涉及 主题 广泛 , 覆盖 干预 措施 疗效 和 数 千 篇 针对 诊断 试验 ` 公 共 了 卫生、 健康 促 
进 、 药 学 手术、 心理 学 卫生 体系 和 服务 的 系统 评价 摘要 。DARE 既是 独立 信息 资源 , 也 包含 
在 Cochrane 图 书馆 中 , 每 年 收录 约 600 篇 , 检索 简单 方便 。 

(三 ) 系统 评价 

1. Cochrane 系统 评价 数据 库 ”Cochrane 系统 评价 数据 库 ( Cochrane Database of Systematic 
Reviews, CDSR ) 发 表 在 Cochrane 图 书馆 ( http://www3.interscience.wiley.com/cgi-bin/mrwhome/ 
106568753/HOME ), Cochrane 系统 评价 是 Cochrane 协作 网 的 评价 员 按 照 统 一 工作 手册 ( Cochrane 
Handbook for Systematic Reviews of Interventions ), 在 相应 Cochrane 评价 小 组 编辑 部 的 指导 和 帮 
助 下 所 完成 的 系统 评价 。 由 于 Cochrane 协作 网 有 严密 的 组 织 管理 和 质量 控制 系统 , 严格 遵循 
Cochrane 系统 评价 者 指导 手册 , 采用 固定 格式 和 内 容 , 统一 的 系统 评价 软件 (RevMan ) 录 入 和 分 
析 数 据 、 扎 写 系统 评价 计划 书 和 报告 , 发 表 后 根据 新 的 研究 定期 更 新 , 有 完善 的 反馈 和 修改 机 
制 , 因此 Cochrane 系统 评价 的 质量 比 收录 在 Medline 和 其 他 数据 库 的 非 Cochrane 系统 评价 质量 
更 高 。 目 前 主要 针对 疾病 防治 、 康 复 疗效 和 安全 性 的 随机 对 照 试验 进行 评价 , 诊断 性 试验 的 系 
统 评价 刚 起 步 。2012 年 第 7 期 的 Cochrane 系统 评价 数据 库 包括 5131 篇 全 文系 统 评价 和 2235 
篇 研究 方案 。Cochrane 系统 评价 可 从 Ovid、PubMed、 光盘 和 Wiley 网 站 获取 。CDSR 检索 方便 ， 
摘要 免费 , 但 全 文 需要 付费 。 

2. EvidenceUpdates EvidenceUpdates( http://plus.memaster.ca/EvidenceUpdates ) 是 主要 的 
且 经 过 评价 的 系统 评价 单一 数据 源 , 由 BMJ 集团 免费 提供 。EvidenceUpdates 包括 所 有 Cochrane 
系统 评价 、120 多 种 临床 杂志 发 表 的 系统 评价 及 由 美国 AHRQ 组 织 、 加 拿 大 药品 和 卫生 技术 机 
构 委 托 完成 的 系统 评价 .英国 NHS 卫生 技术 评估 等 。 

3. 其 他 资源 除 上 述 资源 外 ,也 可 从 PubMed 和 Embase 数据 库 查寻 系统 评价 ,但 需要 检索 
者 自己 评价 质量 。 

(四 ) 原始 研究 摘要 

1. ACP Journal Club ”由 方法 学 家 和 临床 专家 对 主要 医学 期 刊 上 发 表 的 原始 研究 从 方法 
学 和 临床 重要 性 两 方面 评价 ,第 选 出 高 质量 论著 以 结构 摘要 的 形式 再 次 出 版 ,并 附 专家 推荐 意 
见 ( 形 同 系统 评价 摘要 )。 

2. InfoPOEMs InfoPOEMs(http://www.infopoems.com/) 类 似 于 ACP Journal Club, 有 助 于 了 
解 临 床 新 进展 , 重点 针对 家 庭 医学 。 临 床 人 员 从 100 多 种 杂志 中 筛选 出 与 家 庭 医生 常见 问题 相 
关 的 文献 进行 评估 和 总 结 。 

3. Bandolie Bandolie( http://www.jr2.ox.ac.uk/bandolier/) 是 为 英国 国立 卫生 服务 中 心 提供 
的 证 据 , 选择 的 主题 涉及 各 临床 专业 , 评估 的 证 据 包括 评论 和 推荐 意见 。 

另外 , 美国 医学 研究 院 (New York Academy of Medicine, http://www.ebmny.org/jour-nal.htm ) 网 
站 列 出 了 包括 ACP Journal Club 在 内 的 经 过 评估 的 信息 资源 库 , 可 供 链接 查寻 。 
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(五 ) 原始 研究 

原始 研究 文献 数量 最 为 庞大 , 通常 只 有 在 上 述 四 种 数据 库 资 源 中 未 能 检索 到 需要 的 文献 时 
才 检 索 原始 研究 数据 库 。 

1. MEDLINE 及 PubMed Clinical Queries MEDLINE 是 卫生 研究 和 医疗 实践 的 首选 数据 
库 。 检 索 MEDLINE 的 途径 很 多 , 但 多 数 通 过 Ovid 和 PubMed 途径 。 

通过 PubMed(http://www.ncbi.nlm.nih.gov/PubMed/) 可 检索 整个 MEDLINE 数据 库 , 其 Clinical 
Queries( http://www.ncbi.nlm.nih.gov/entrez/query/static/clinical.shtml ) 检 索 可 直接 获得 与 临床 应 用 
相关 的 文献 资料 。 

2. Embase Embase(http://www.elsevier.com/wps/find/bibliographicdatabasedescription.cws_ 
home/523328/description#description ) 是 欧洲 的 大 型 医学 文献 数据 库 , 与 MEDLINE 类 似 , 但 重点 
在 药物 和 卫生 领域 。 由 于 Embase 数据 库 检索 费用 高 , 可 及 性 差 , 临床 医生 少 有 采用 。Embase 
中 约 70% 的 条 目 未 包括 在 MEDLINE。 

3. Cochrane 临床 对 照 试验 中 心 注册 库 ”Cochrane 临床 对 照 试 验 中 心 注册 库 (Cochrane 
Central Register of Controlled Trials, CENTRAL) 是 随机 对 照 试验 和 半 随 机 对 照 试验 的 数据 库 , 该 
数据 库 由 Cochrane 协助 网 组 织 、 协 调和 编制 ,采用 计算 机 和 手工 检索 相 结 合 的 方法 , 对 期 刊 、 会 
议论 文集 、MEDLINE 和 Embase 及 其 他 文献 数据 库 收录 的 刊物 进行 检索 , 确定 其 中 的 随机 对 照 
试验 和 半 随 机 对 照 试验 , 为 进行 系统 评价 提供 系统 、 全 面 和 准确 的 原始 研究 文献 库 。 

4. 中 国生 物 医学 文献 数据 库 ” 中 国生 物 医学 文献 数据 库 (CBM) 是 中 国医 学 科学 院 医学 信 
息 研 究 所 开发 研制 的 综合 性 医学 文献 数据 库 。 该 数据 库 收 录 了 1978 年 以 来 1600 多 种 中 国生 
物 医学 期 刊 及 汇编 、 会 议论 文 的 文献 题 录 , 收录 范围 涉及 基础 医学 、 临 床 医学 、 预 防 医学 、 药 学 、 
中 医学 、 中 药学 等 生物 医学 的 各 个 领域 。 该 数据 库 的 研制 兼顾 了 与 MEDLINE 光盘 检索 系统 的 
兼容 性 , 其 检索 过 程 中 使 用 的 运算 符号 及 功能 与 MEDLINE 光盘 相似 。 检 索 系统 具有 主题 词 表 、 
中 英文 主题 词 轮 排 表 、 分 类 表 、 期 刊 表 、 索 引 词 表 、 作 者 表 等 多 种 词 表 辅助 检索 功能 , 检索 入 口 
多 ,检索 功能 完备 。 

5. 中 文生 物 医学 期 刊 数据 库 ”中 文生 物 医 学 期 刊 数据 库 ( Chinese Medical Current Contents， 
CMCC ) 是 解放 军医 学 图 书馆 研制 开发 的 中 文生 物 医学 文献 书目 型 数据 库 , 也 是 目前 检索 国内 生 
物 医 学 文献 最 常用 的 光盘 数据 库 之 一 。CMCC 数据 库 收 录 了 1994 年 以 来 国内 正式 出 版 发 行 的 
生物 医学 期 刊 和 一 些 自 办 发 行 的 生物 医学 刊物 1400 余 种 的 文献 题 录 和 文摘 。 涉 及 的 主要 学 科 
领域 有 基础 医学 、 临床 医学 、 预 防 医学 、 药 学 、 医 学 生物 学 、 中 医学 .中药 学、 医院 管理 及 医学 信 
息 等 生物 医学 的 各 个 领域 。CMCC 数据 库 的 数据 与 CBM 的 数据 从 1994 年 后 大 部 分 是 相同 的 ， 
因此 检索 1994 年 后 的 中 文 医学 文献 选用 其 中 之 一 即 可 。 但 由 于 CMCC 的 数据 更 新 周期 为 2 周 ， 
因此 检索 最 新 报道 的 生物 医学 文献 时 可 选用 。 

6. 中 国 期 刊 全 文 数据 库 ”中 国 期 刊 全 文 数据 库 是 中 国 知识 基础 设施 工程 (China National 
Knowledge Infrastructure, CNKI, http://www.cnki.net/index.htm ) 中 最 重要 的 数据 库 。CNKI 是 目前 
世界 上 最 大 的 连续 动态 更 新 的 中 国 期 刊 全 文 数据 库 , 收录 了 自 1994 年 以 来 (部 分 回溯 至 1979 
和 创刊 年 ) 国 内 8200 多 种 重要 期 刊 , 内 容 材 盖 自 然 科学 、 工 程 技术 农业、 哲学 、 医 学、 人 文 社会 
科学 等 各 个 领域 , 全 文 文献 总 量 2200 多 万 篇 。 本 数据 库 集 题 录 文摘、 全文 文 献 信息 于 一 体 ， 
实现 一 站 式 文献 信息 检索 ; 具有 知识 分 类 导航 功能 、 众 多 检索 人 口 等 功能 。 

7. 中 文科 技 期 刊 数据 库 ”中 文科 技 期 刊 数据 库 (VIP) 由 重庆 维普 资讯 有 限 公司 开 发 , 是 一 
种 综合 性 文献 数据 库 , 收录 了 1989 年 以 来 8000 余 种 中 文科 技 期 刊 , 涵盖 自然 科学 、 工 程 技术 、 
农业 科学 .医药 卫生 、 经 济 管理 、 教 育 科 学 和 图 书 情报 等 七 大 专辑 。 该 数据 库 在 高 校 一 般 有 镜 
像 站 点 或 远程 访问 方式 。 
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二 节 ”证 据 检索 和 收集 的 基本 步 又 
检索 和 收集 证 据 的 基本 步骤 如 下 (图 5-1); 


图 5-1 医学 文献 的 检索 策略 












| 重新 选择 合适 数据 库 。 | 
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重新 制定 检索 词 和 检索 策略 











评价 、 总 结 研究 证 据 








应 用 研究 证 据 


一 、 确 定 临床 问题 类 型 和 构建 临床 问题 

常见 的 临床 问题 主要 涉及 疾病 的 病因 、 诊 断 、 预 防 、 治 疗 、 预 后 及 不 良 反 应 , 针对 每 一 问题 ， 
根据 需要 了 解 的 信息 不 同 又 分 为 背景 问题 ( “background”duestions ) 和 前 景 问题 (“foreground” 
questions )。 背 景 问题 是 关于 某 种 疾病 、 某 一 诊断 技术 或 某 一 干预 措施 的 一 般 知 识 , 如 心房 纤 题 
是 如 何 引起 栓塞 的 ?哪些 人 容易 发 生 甲 型 流感 ” 卡 托 普 利 是 如 何 引起 干咳 的 ”前 景 问题 涉及 
临床 诊断 、 治 疗 的 具体 知识 。 循 证 临床 实践 过 程 中 , 提出 的 多 数 问题 均 为 前 景 问题 , 如 某 诊 断 
试验 能 否 准 确诊 断 某 疾病 y 某 干预 措施 的 疗效 和 安全 性 如 何 ? 回答 前 景 问 题 , 需要 明确 问题 涉 
及 的 4 个 要 素 : 研究 对 象 ( patient)、 干预 措施 (intervention)、 与 干预 措施 比较 的 措施 (comparison 
intervention ) 和 关心 的 结果 (outcome), 即 根据 PICO 原则 精心 构建 提出 的 前 景 问题 。 

明确 临床 问题 类 型 及 需要 了 解 的 信息 .按照 PICO 原则 构建 临床 问题 , 有 助 于 正确 选择 数据 
库 资 源 、 合 理 制定 检索 词 和 检索 策略 。 如 背景 问题 我 们 可 选择 教材 .专著 和 综述 等 , 在 Cochrane 
图 书馆 就 不 可 能 获得 有 关 疾 病 病因 、 致 病 机 理 等 方面 的 详细 信息 。 而 有 关 干 预 措 施 疗效 ， 
Cochrane 图 书馆 则 是 主要 信息 来 源 。 


二 、 选 择 合适 数据 库 
选择 数据 库 ,需要 了 解 各 数据 库 的 特点 ,涉及 的 专业 范畴 和 针对 的 临床 问题 类 型 。 此 外 ， 
尚 需 注意 下 列 原则 
1. 选择 计算 机 或 网 络 数据 库 针对 临床 问题 , 可 通过 四 种 途径 获得 答案 : 咨询 同事 或 专家 、 
查阅 教科 书 或 专著 、 手 工 查阅 相关 杂志 和 计算 机 检索 相关 文献 数据 库 。 咨 询 同事 或 专家 是 快 
速 、 有 效 获取 信息 的 方法 , 却 受 被 咨询 者 知识 更 新 程度 的 制约 ,常常 存在 一 定 偏 倚 ; 教科 书 或 专 
著 出 版 周期 长 , 知识 更 新 慢 ; 手工 查阅 相关 杂志 能 较 快 获得 最 新 的 信息 , 但 非常 费时 ; 而 计算 机 
检索 克服 了 时 空 障碍 , 只 要 掌握 基本 的 技巧 , 既 快 速 又 高 效 。 
2. 尽 可 能 选择 专业 数据 库 综合 性 文献 数据 库 如 MEDLINE 中 国生 物 医学 文献 数据 库 (CBM ) 
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等 虽然 覆盖 了 医学 领域 从 基础 到 应 用 、 各 专业 领域 的 资料 ， 但 有 时 却 难以 快速 获得 你 真正 需要 
的 信息 。 因 此 , 使 用 专业 数据 库 更 方便 , 易 获得 与 专业 直接 相关 的 文献 资料 。 但 在 缺乏 专业 数 
据 库 时 ,综合 性 文献 数据 仍然 是 最 常用 的 信息 资源 。 

3. 尽 可 能 选择 最 佳 文献 数据 库 ”最 佳 证 据 资源 (best-evidence resources ) 是 指 采 用 明确 的 方 
法 ,对 研究 证 据 的 科学 性 和 临床 相关 性 进行 严格 评价 后 建立 的 数据 库 。 由 于 医学 文献 的 层 出 不 
穷 , 临床 医生 应 改变 传统 的 文献 查寻 方法 和 技巧 ， 从 针对 某 一 问题 检索 所 有 相关 文献 改变 为 按 
照 “6S" 模型 检索 文献 , 以 便 快速 .高效 获取 最 佳 证 据 资源 。 根 据 “6S" 模型 , 检索 时 应 从 证 据 系 
统 (system) 证 据 集成 (summaries)、 系统 评价 摘要 (synopses of syntheses )、 系统 评价 (syntheses js 
原始 研究 摘要 (synopses of studies ) 和 原始 研究 (studies ) 逐 级 检索 ， 原则 上 如 果 从 上 一 级 数据 库 
检索 的 文献 解决 了 提出 的 临床 问题 , 则 无 需 继续 检索 下 一 级 数据 库 。 


三 、 选 定 检索 词 和 制定 检索 策略 


(一 ) 检索 词 

检索 词 的 确定 主要 基于 对 提出 的 临床 问题 的 分 解 单元 , 即 PICO 要 素 。 通常 检索 词 主要 来 
源 于 P( 研 究 对 象 ) 和 了 (干预 措施 ), 而 较 少 采 用 C( 对 照 措 施 ) 和 0( 结 果 指 标 )。 当 根据 P 和 1 检 
索 结 果 太 多 时 , 可 考虑 通过 C 和 0 进行 限定 。 

(二 ) 检索 策略 

不 同 数据 库 , 检索 策略 不 全 相同 。 检 索 策 略 就 是 采用 逻辑 运算 符 “AND”"、“OR” 和 “NOT” 将 
检索 词 进行 组 合 的 方式 。 

1. 扩大 检索 范围 , 提高 查 全 率 ” 当 检索 的 记录 太 少 时 , 可 以 使 用 以 下 方式 提高 查 全 率 : 

(1) 用 主题 词 表 (thesaurus ) 进 行 检索 : 如 使 用 所 选 词 的 上 位 词 进行 检索 、 对 主题 词 进行 扩展 
检索 .选用 多 个 主题 词 检索 .选用 全 部 副 主题 词 或 对 副 主 题词 进行 扩展 检索 .选用 词 表 提示 的 
相关 词 或 以 前 的 检索 词 进行 检索 。 

(2 ) 用 自由 词 检 索 : 如 果 一 个 需 检索 的 概念 由 几 个 自由 词组 成 一 个 语句 , 应 选用 最 能 表达 
该 概念 的 最 少 的 自由 词 进行 检索 , 因为 一 个 语句 中 自由 词 的 数量 与 检 出 的 文献 量 成 反比 。 

(3) 用 “OR” 运算 符 : 用 “OR” 运算 符 可 选择 新 的 检索 词 ,也 可 把 同等 或 同 义 的 检索 词 伙 加 
组 合 起 来 进行 检索 , 因此 扩大 了 检索 范围 。 

(4) 用 截 词 : 对 检索 词 的 词根 或 词尾 加 上 截 词 符 “*" 进行 扩展 检索 , 可 扩大 检索 词 的 范围 ， 
并 防 漏 检 。 但 用 截 词 法 耗费 机 时 , 而 且 容 易 产 生 假 命中 , 应 谨慎 使 用 。 

(5) 用 通配符 检索 : 用 通配符 “?” 加 在 检索 词 中 进行 检索 , 可 以 检索 出 拼 法 不 同 而 意义 相同 
或 相近 的 词 , 从 而 扩大 检索 范围 。 

2. 缩小 检索 范围 , 提高 查 准 率 ”如果 检 索 出 的 文献 太 多 , 可 以 用 以 下 方法 来 缩小 检索 范围 。 

(1) 用 主题 词 表 进 行 检索 : 如 选用 主题 词 专 指 性 不 强 , 上 且 该 词 下 还 有 下 位 词 , 可 选用 下 位 词 

(2) 选 准 副 主 题词 进行 检索 。 

(3) 应 用 限定 字段 检索 : 限定 字段 检索 时 , 常用 的 字段 有 TI、AU、AD、PY、CP、AB、MESH、 
MJME .TG .NM 、PT 等 。 如 要 提高 通过 主题 词 检索 的 准确 性 , 可 将 检索 结果 限定 在 主要 主题 词 
字段 进行 检索 。 

(4) 用 运算 符 : 常用 不 缩小 检索 范围 , 提高 查 准 率 的 运算 符 有 AND 、WITH .NEAR、NOT 等 。 

完成 检索 策略 后 , 针对 选择 的 数据 库 进 行 检索 。 


四 、 判 断 检索 结果 
获得 检索 结果 后 , 应 判断 所 获 信息 能 否 回答 提出 的 临床 问题 。 如 果 不 能 获得 满意 答案 , 应 
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分 析 原 因 , 是 否 数据 库 选择 不 当 、 是 否 检索 词 和 检索 策略 制定 不 合理 , 还 是 确实 该 临床 问题 尚 
无 相关 研究 证 据 。 如 果 是 从 未 经 评价 的 数据 库 中 检索 的 信息 , 尚 需 对 检 出 的 文献 进行 严格 质量 
评价 以 确定 其 结果 的 真实 性 临床 重要 性 和 适用 性 。 
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一 、 证 据 检 索 实 例 一 
(一 ) 提出 临床 问题 
糖尿 病 趾 者 会 发 生 诸 多 并 发 症 ,例如 心血 管 疾病 、 肾 脏 疾病 、 眼 底 病变 和 神经 系统 疾病 等 。 
糖尿 病 患 者 发 生 心血 管 疾病 和 因 心血 管 疾病 死亡 的 风险 明显 高 于 非 糖尿 病 患者 。 糖 尿 病 虽 
合并 高 血压 以 后 , 容易 发 生 眼 底 、 肾 脏 、 心 脏 、 下 上肢 血管 和 脑 血管 疾病 。 因 此 , 糖尿 病 合并 高 
压 患 者 的 降 血 脂 治 疗 很 重要 , 血脂 的 干预 水 平 要 严 于 非 糖尿 病 患者 。 me 
一 观点 呢 ? 








临床 病案 1: 一 名 55 岁 男性 患者 , 有 2 型 糖尿 病史 18 年 ,高 血压 病史 12 年 ,其 血糖 和 
血压 水 平一 直 控制 良好 。 没 有 心肌 梗死 心绞痛 、 脑 血管 意外 和 外 周 血 管 病史 。 最 近 复 诊 ， 
血脂 检查 结果 为 : 总 胆固醇 5.2mmol/L,LDL- 胆固醇 3.0mmol/L, HDL- 胆固醇 1.6mmol/L， 
甘油 三 酯 1.8mmol/L。 你 似 曾 记 得 , 某 次 讲座 中 讲授 者 说 : 对 于 2 型 糖尿 病 患 者 , 即使 血脂 
水 平 不 高 , 降 脂 治疗 也 可 预防 心血 管 疾病 的 发 生 。 考 虑 到 降 脂 治疗 的 长 期 性 及 他 汀 类 降 
脂 药 可 能 的 不 良 反 应 。 因 此 ,你 认为 ,在 向 患者 推荐 该 治疗 方案 前 ,是 否 需 要 明确 有 无 研 
究 证 据 支 持 这 种 说 法 ? 

















临床 问题 : 血脂 正常 、 无 心 脑 血管 病史 的 2 型 糖尿 病 患 者 ,采用 他 汀 类 降 脂 药 与 安奈 剂 比 
较 , 能 否 预 防 心血 管 病 的 发 生 ? 

(二 ) 构建 临床 问题 

按照 PICO 原则 分 解 上 述 临 床 问题 ( 表 5-2), 检 出 与 上 上述 临 床 问题 直接 相关 的 研究 证 据 。 











表 5-2 构建 临床 问题 





P: 患者 及 问题 血脂 正常 、 无 心 脑 血管 病史 的 2 型 糖尿 病 患 者 
I: 干预 措施 采用 他 汀 类 降 脂 药 
C: 比较 措施 安慰 剂 


0: 结果 预防 心血 管 病 的 发 生 
一 “0: 结果 预防 心血 管 病 的 发 上 


(三 ) 检索 相关 研究 证 据 

不 同 医学 文献 资料 在 设计 、 实 施 、 统 计 分 析 、 结 果 解释 和 论文 报告 等 方面 存在 着 差异 ,研究 
质量 、 结 果真 实 性 和 可 靠 性 及 适用 性 也 不 同 。 因 此 , 检索 证 据 时 ,建议 首先 检索 经 他 人 评估 和 
筛选 过 的 循 证 医学 资源 , 如 果 未 检索 出 需要 的 信息 , 再 进一步 检索 未 经 筛选 的 数据 库 。 

1. 选择 数据 库 

(1) 首先 检索 经 过 评估 或 筛选 的 循 证 医学 信息 资源 

® Clinical Evidence 

® BestEvidence(Evidence-based Medicine and ACP Journal Club) 

® Cochrane Library: Cochrane Database of Systematic Reviews( CDSR ) 

® UpToDate 
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@@ SUMSearch 

(2) 再 考虑 检索 未 经 评估 或 筛选 的 综合 信息 资源 

® PubMed 

® Embase 

© CBM 

2. 确定 检索 词 和 检索 策略 

(1) 检索 词 : 根据 构成 临床 问题 的 四 要 素 , 本 病例 检索 可 选择 的 检索 词 包括 : type 2 diabetes、 
statin 和 cardiovascular diseaseo : 

(2) 检索 策略 ; 上 述 临床 问题 采用 检索 词 “type 2 diabetes”、“statin*” 和 “cardiovascular disease*” 
制定 检索 策略 [type 2 diabetes ] AND [ statin* ] AND [ cardiovascular disease* ]， 并 根据 检索 的 数据 
库 相 应 调整 。 

3. 检索 相关 数据 库 ”我 们 检索 了 Cochrane 图 书馆 , 未 发 现 1 篇 相关 系统 评价 , 只 有 1 篇 经 
济 学 评价 的 相关 文献 。 再 检索 PubMed, 在 “PubMed Services” 下 点 击 “Clinical queries”, 输入 检索 
词 ,在 “Category” 下 点 击 “Therapy”, “Scope” 下 点 击 “narrow, specific search”, 获得 38 篇 文献 (1966 一 
2010 年 2 月 9 日 )。 最 相关 的 为 Colhoun 等 的 文章 : “Primary prevention of cardiovascular disease with 
atorvastatin in type 2 diabetes in the Collaborative Atorvastatin Diabetes Study( CARDS): multicentre 
randomised placebo-controlled trial. Lancet 2004; 364: 685-96” 。 

4. 判断 检索 结果 ”获得 检索 结果 后 首先 应 该 判断 该 结果 能 否 回答 之 前 提出 的 临床 问题 ， 
对 未 经 评价 的 文献 , 还 需要 进行 严格 的 质量 评价 。 

针对 上 述 问题 检 出 的 38 篇 文献 , 仔细 阅读 题目 和 摘要 ,结合 具体 情况 , 发 现 Colhoun 等 的 文 


章 “Primary prevention of cardiovascular disease with atorvastatin in type 2 diabetes in the Collaborative 





Atorvastatin Diabetes Study( CARDS): multicentre randomised placebo-controlled trial. Lancet 2004; 
364: 685-96" 一 文 与 提出 的 临床 问题 最 相关 。 但 此 文献 来 自 PubMed, 未 经 过 质量 评价 , 因此 需 
要 按照 治疗 性 研究 的 质量 评价 原则 分 析 此 文献 结果 的 真实 性 、 临 床 重要 性 、 可 靠 性 和 适用 性 ( 参 
见 本 教材 第 十 一 章 ), 以 确定 能 否 正确 回答 上 述 临床 问题 。 


二 、 证 据 检索 实例 二 








临床 病案 2: 一 名 孕 25 周 出 生 的 早产 儿 , 出 生 后 30 天 胸骨 左 缘 第 2 肋 间 闻 及 连续 性 
杂音 ,脉搏 增强 。 医 生 临 床 诊断 为 “动脉 导管 未 闭 (patent ductus arteriosus, PDA)” 并 已 给 
耶 呀 嗓 美 辛 治疗 PDA 一 个 疗程 。 婴 儿 非 常 虚弱 且 依赖 呼吸 机 辅助 呼吸 ,不便 搬 动 做 超声 
心动 图 检查 以 确诊 患 儿 是 否 有 PDA。 那 么 此 时 ,能 否 根据 体格 检查 结果 (体征 ) 能 否 诊断 
患 儿 的 PDA 呢 ? 








(一 ) 提出 临床 问题 

动脉 导管 未 闭 是 早产 儿 最 常见 的 先天 性 心脏 病 , 若 未 及 时 诊断 与 处 理 , 常 可 诱发 或 促进 充 
血性 心 衰 .慢性 肺 疾病 、 颅 内 出 血 和 坏死 性 小 肠 结 肠炎 (NEC ) 等 的 发 生发 展 。 足 月 儿 50% 在 
生 后 24 小 时 内 ,90% 在 48 小 时 内 , 几乎 100% 在 72 小 时 内 动脉 导管 (DA) 关 闭 ,在 生 后 1~3 个 
月 常 达到 完全 解剖 上 关闭 。 但 若 胎 龄 <29 周 , PDA 发 生 率 在 0~24 小 时 为 80% , 24~48 小 时 为 
40% , 48-~72 小 时 为 7%。 早 产儿 一 旦 确诊 为 持续 性 PDA, 建议 尽早 治疗 。 药 物 ( 吗 唆 美 辛 等 ) 和 
手术 (PDA 结扎 ) 治 疗 PDA 安全 、 有 效 。 因 此 ,应 尽早 确诊 ,减少 并 发 症 发 生 。 

超声 心动 图 诊断 PDA 最 敏感 准确 , 临床 体征 较 退 发 生 , 但 对 判断 与 PDA 有关 的 远 期 疾病 发 
生 关 系 更 密切 。 常 见 临 床 体征 包括 连续 性 杂音 、 心 前 区 搏动 增强 、 水 冲 脉 、 脉 压 增 大 或 存在 进 
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行 机 械 通气 的 指 征 。 体 征 不 同 诊断 意义 也 不 同 。 作 为 标准 诊断 方法 的 超声 心动 图 虽然 准确 , 但 
该 患 儿 病情 危重 ,不便 搬 动 , 而 床 旁 超声 心动 图 机 并 不 是 任何 医院 均 有 。 如 果 临 床 体征 能 作为 
第 查 手段 ,将 有 助 于 早期 诊断 和 治疗 。 尽 管 临床 体征 广泛 用 于 PDA 的 初步 诊断 , 其 准确 度 到 底 
如 何 呢 ? 能 否 有 助 于 诊断 上 述 早产 儿 的 PDA 呢 ? 

临床 问题 : 对 依赖 呼吸 机 辅助 呼吸 的 极 低 体重 (体重 <1000g) 早 产儿 , 临床 体征 诊断 PDA 
的 准确 性 如 何 ? 

(二 ) 构建 临床 问题 

按照 PICO 原则 分 解 上 述 临床 问题 ( 表 5-3 ), 检 出 与 上 述 临床 问题 直接 相关 的 研究 证 据 。 


表 5-3 ”构建 临床 问题 


P: 患者 及 问题 极 低 体重 早产 儿 

I: 干预 措施 临床 体征 

C: 比较 措施 超声 心动 图 ( 金 标 准 ) 
0: 结果 诊断 动脉 导管 未 闭 


(三 ) 检索 相关 研究 证 据 

不 同 医学 文献 资料 在 设计 、 实 施 、 统 计 分 析 、 结果 解释 和 论文 报告 等 方面 存在 着 差异 , 研究 
质量 、 结果 真实 性 和 可 靠 性 及 适用 性 也 不 同 。 因 此 , 检索 证 据 时 ， 建议 首先 检索 经 他 人 评估 和 
筛选 过 的 循 证 医学 资源 ， 如 果 未 检索 出 需要 的 信息 ， 再 进一步 检索 未 经 筛选 的 数据 库 。 

1. 选择 数据 库 。 目 前 尚 无 专门 针对 诊断 试验 证 据 的 数据 库 , 只 能 通过 综合 性 数据 库 检索 
诊断 试验 证 据 。 

(1) 首先 检索 经 过 评估 或 第 选 的 循 证 医学 信息 资源 

® Best Evidence(Evidence-based Medicine and ACP Journal Club ) 

® Cochrane Library: Cochrane Database of Systematic Reviews( CDSR ) 

® UpToDate 

® SUMSearch 

(2) 再 考虑 检索 未 经 评估 或 筛选 的 综合 信息 资源 

® PubMed 

® 上 mbase 

® CBM 

2. 确定 检索 词 和 检索 策略 | 

(1) 检索 词 : 根据 构成 临床 问题 的 四 要 素 , 本 病例 检索 可 选择 的 检索 词 包 括 : patent arterial 
duct 、 diagnostic test , clinical examination 、 sensitivity 、 specificity 、 pretermo _ 

(2) 人 用 交 失 ， 上 述 临床 问题 采用 检索 词 patent arterial duct、 Sensiintys BELO 制定 检索 策 
略 [ patent arterial duct ]AND [ Sensitivity ]AND preterm, 并 根据 检索 的 数据 库 相 应 调整 。 n 

3. 检索 相关 数据 库 ”首先 检索 二 次 文献 数据 库 Best Evidence 和 CDSRs 未 检 出 相关 文献 。 

再 检索 PubMed( http://www.ncbi.nlm.nih.gov/PubMed/), 从 页 面 左 侧 的 “Clinical Queries” 进 
人 检索 口 “Search by Clinical Study Category”, 输入 “[ patent arterial duct ] AND [ sensitivity ] 人 
preterm”, 在 “category” 下 选择 “qiagnosis”, 在 “scope” 下 选择 “broad， sensitive search”, 检 出 33 篇 
相关 文献 。 ee 

4. 判断 检索 结果 ”获得 检索 结果 后 首先 应 该 判断 该 结果 能 否 回答 之 前 提出 的 临床 问题 ， 
对 未 经 评价 的 文献 , 还 需要 进行 严格 的 质量 评价 。 _ 

针对 上 述 问题 检 出 的 33 篇 文献 , 仔细 阅读 题目 和 摘要 , 结合 具体 情况 , 发现 “Davis P, Turner- 


| i i igns i > > infants 
Gomes S， Cunningham K, et al. Precision and accuracy of clinical and radiological signs in premature i? 





第 五 章 ”医学 研究 证 据 的 检索 与 收集 


at risk of patent ductus arteriosus. Arch Pediatr Adolesc 1995; 149(10): 1136-41” 一文 与 提出 的 临床 
问题 最 相关 。 但 此 文献 来 自 PubMed, 未 经 过 质量 评价 ， 因此 需要 按照 诊断 试验 的 质量 评价 原则 
分 析 此 文献 结果 的 真实 性 临床 重要 性 、 可 靠 性 和 适用 性 参见 本 教材 第 九 章 ), 以 确定 能 否 正 
确 回答 上 述 临 床 问题 。 

( 李 静 吕 . 明 ) 
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学 会 阅读 和 评价 医学 研究 文献 是 对 临床 医生 和 医学 生 职 业 素养 的 基本 要 求 。 这 是 因为 , 临 
床 医生 所 从 事 的 医 、 教 、 研 工作 , 与 临床 研究 息息相关 , 需要 对 医学 研究 文献 进行 阅读 与 评价 。 
如 在 临床 实践 中 ,为 避免 知识 老化 和 保持 临床 技能 水 平 不 降低 , 特别 是 当 遇 到 自己 难以 解决 的 
诊断 病因 、 防 治 、 预 后 问题 时 ,除了 咨询 同事 或 向 上 级 医生 请 教 外 , 更 多 的 则 是 通过 检索 、 阅读 
与 评价 医学 研究 文献 , 从 中 寻找 答案 ; 在 临床 教学 过 程 中 , 同样 需要 及 时 掌握 本 学 科 的 新 知识 、 
新 进展 , 以 更 好 地 向 学 生 传授 专业 知识 ; 在 临床 科研 的 选 题 立 题 、 提 出 科学 假设 过 程 中 , 也 需 先 
期 进行 大 量 的 文献 复习 , 以 充分 掌握 相关 研究 领域 的 历史 、 现 状 及 存在 问题 , 由 此 , 提出 立 题 依 
据 、 明 确 研究 重点 。 然 而 , 临床 医生 的 工作 性 质 决定 了 他 们 不 可 能 有 过 多 的 时 间 去 阅读 相关 和 研 
究 文献 , 这 就 要 讲究 一 定 的 文献 阅读 方法 和 技巧 , 通过 提高 阅读 效率 , 完成 必要 的 文献 阅读 以 
及 知识 的 更 新 与 储备 。 因 此 , 掌握 正确 的 医学 文献 阅读 与 评价 方法 , 科学 有 效 地 管理 好 医学 专 
业 文献 , 将 有 助 于 临床 实践 、 教 学 和 科研 , 同时 也 是 临床 医生 实现 自我 终身 学 习 、 保 持 与 提高 临 
床 技能 水 平 的 必由之路 。 
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一 、 医 学 研究 文献 的 特殊 性 

(一 ) 数量 庞大 

医学 研究 文献 比较 特殊 , 首先 医学 文献 数量 非常 庞大 且 仍 处 于 快速 增长 之 中 , 已 位 居 各 学 
科 文献 量 之 首 。 同 时 医学 文献 还 具有 载体 多 、 发 表 语种 多 的 特点 , 以 及 重复 发 表 、 发表 分 散 以 
及 滞后 发 表 等 一 系列 问题 。 例 如 , 全 球 范围 内 生物 医学 期 刊 已 有 数 万 种 之 多 , 每 年 发 表 文献 达 
几 百 万 篇 以 上 。 此 外 , 还 有 大 量 的 电子 文献 出 版 物 、 未 公开 发 表 的 文献 以 及 灰色 文献 等 , 从 而 
形成 了 海量 的 医学 研究 文献 以 及 医学 信息 资源 。 学 会 正确 地 阅读 和 评价 医学 文献 , 其 重要 性 不 
言 而 喻 , 因此 , 医学 生 和 临床 医生 应 具备 一 定 的 检索 、 阅 读 以 及 评价 医学 研究 文献 的 能 力 , 学 会 
从 中 汲取 有 用 的 知识 和 信息 。 

(二 ) 医学 文献 的 分 类 体系 复杂 、 质 量 参差 不 齐 

文献 是 指 以 文字 、 图 像 .公式 、 视 频 与 音频 .代码 等 形式 , 将 信息 、 知 识 记录 或 描述 加 以 存 
储 、 传 播 的 一 切 载体 。 医 学 文献 就 是 记录 有 医学 相关 知识 或 信息 等 载体 的 总 称 。 

1. 按照 载体 的 属性 可 分 为 书写 型 、 印 串 型 .电子 型 微缩 型 和 视听 型 等 文献 类 型 。 其 中 书 
写 型 文献 专 指 手工 书写 与 抄写 的 文献 , 如 病历 、 实 验 原始 记录 设计 草图 等 。 印 刷 型 文献 特 指 
纸 制 出 版 物 , 为 图 书馆 收藏 的 主要 类 型 , 种 类 繁多 , 包括 医药 图 书 (专著 .教科书 、 工 具 书 )、 生 物 
医学 期 刊 .学 位 论文 、 会 议 文献 .研究 报告 或 官方 出 版 物 (如 卫生 年 鉴 )、 专 利文 献 .医疗 器 械 技 
术 标 准 以 及 产品 资料 、 医 疗 技术 档案 等 。 电 子 型 文献 是 指 医学 信息 以 光盘 、 网 络 .软盘 等 形式 
存储 和 传播 , 目前 已 成 为 主要 文献 主体 , 旦 有 逐步 取代 印刷 型 文献 之 势 。 

2. 按照 研究 内 容 和 组 织 形式 , 医学 文献 又 可 分 为 一 次 文献 二 次 文献 三 次 文献 以 及 零 次 
文献 等 。 其 中 一 次 文献 又 称 原始 研究 文献 , 是 基于 作者 本 人 的 经 验 总 结 或 者 科研 成 果 而 创作 
的 .具有 一 定 原创 性 的 一 类 文献 。 如 生物 医学 期 刊 中 最 为 常见 的 论著 (article), 是 典型 的 一 次 文 
献 , 数 量 庞大 , 已 达到 数 千 万 篇 之 多 ; 为 方便 检索 .利用 这 些 原始 研究 文献 ,国内 外 一 些 医学 信 
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息 研 究 机 构 或 组 织 , 基于 一 次 文献 的 外 部 特征 进行 收集 、 整 理 \ 压 缩 、 归 类 , 并 按照 一 定 顺序 组 
织 编排 等 初步 加 工 过 程 , 生产 出 一 系列 的 二 次 文献 , 如 书目 、 索 引 、 文 摘 、 题 录 等 。 这 些 二 次 文 
献 具有 汇集 性 、 工 具 性 、 综 合 性 、 系 统 性 等 特点 , 出 版 形式 包括 印刷 型 和 电子 型 等 , 其 中 医学 文 
献 检 索 数据 库 , 以 MEDLINE、Embase、 中国 生物 医学 文献 数据 库 (CBM)、CNKI、 VIP 等, 最 为 常 
用 。 这 些 生 物 医 学 文献 数据 库 , 均 由 专门 机 构 负责 收录 、 整 理 、 加 工 全 球 范围 内 发 表 的 各 类 原 
始 研 究 文献 , 收录 条 目 数量 庞大 , 但 彼此 间 互 有 交叉 、 质 量 也 参差 不 齐 ; 三 次 文献 是 在 充分 利用 
二 次 文献 的 基础 上 对 一 次 文献 做 出 系统 整理 和 概括 , 进而 汇总 编写 而 成 的 综述 性 文献 。 主 要 包 
括 综述 、 年 鉴 、 手 册 、 百 科 全 书 、 文献 指南 等 。 其 中 以 系统 评价 ( systematic review)、 临床 实践 指 
南 (clinical practice guideline, CPG ) 等 最 为 常见 ; 零 次 文献 是 那些 未 经 正式 发 表 或 未 进入 社会 交 
流 的 最 原始 文献 。 如 设计 草图 、 实 验 记录 ,草稿 会议 记录 、 内 部 档案 等 。 

3. 按照 证 据 质量 分 类 ”近年 来 , 随 着 循 证 医学 的 引入 和 推广 , 如 何 获取 证 据 , 特别 是 高 质 
量 的 证 据 , 成 为 临床 医生 实践 循 证 医学 的 关键 , 而 有 重要 临床 价值 的 高 质量 医学 文献 则 是 证 据 
的 主要 来 源 。 为 此 , 加 拿 大 临床 流行 病 学 与 医学 信息 家 R. Brian Haynes 提出 了 6S 证 据 模 型 。 该 
模型 是 由 最 早 的 4S 模型 、5S 模型 衍化 而 来 。6S 类 证 据 依次 为 系统 类 证 据 (systems， 如 计算 机 决 
策 支 持 系 统 CDSS)、 指 南 类 证 据 (summaries, 如 循 证 临床 实践 指南 CPG)、 集 成 类 证 据 (synopses 
of syntheses, 如 DARE、 提 要 类 循 证 医学 杂志 系列 等 )、 系 统 综 述 类 证 据 (syntheses, 如 Cochrane 系统 
评价 /综述 )、 原 始 研 究 提要 类 证 据 (synopses of studies, 如 handbook of clinical practice), 原始 研究 级 
证 据 (studies, 如 ACP JC+ 等 )。 这 6 类 证 据 均 由 专业 组 织 或 机 构 分 别 从 专业 和 方法 学 质量 角度 进 
行 严格 评价 后 经 筛选 而 来 的 证 据 , 证 据 质 量 一 般 较 高 。 因 此 ,按照 证 据 质量 和 级 别 可 将 医学 文献 
分 为 6S 类 证 据 文献 和 非 6S 类 证 据 文献 。 需 要 注意 的 是 , 6S 类 证 据 因 入选 标准 较 高 筛选 制作 要 
求 较为 苛刻 , 同时 耗 时 耗 力 , 生产 数量 比较 少 , 临床 实践 中 有 关 病 因 、 诊 断 、 治 疗 、 预 后 问题 , 多 数 
情况 下 并 无 现成 的 6S 类 证 据 可 供 参 考 , 仍 以 传统 的 、 未 经 严格 评价 的 、 非 65 类 医学 文献 为 主 。 

证 据 级 别 的 分 布 一 般 呈 现金 字 塔 状 , 高 级 别 证 据 是 由 低级 别 文献 信息 综合 提炼 加 工 而 成 ， 
数量 少 , 分 布 在 塔 尖 ; 低 质 量 文 献 或 证 据 数量 庞大 , 分 布 在 塔 底 (图 6-1 左 图 )。 例 如 , 循 证 临床 
实践 指南 是 指导 疾病 防治 的 高 级 别 证 据 , 综合 茶 取 了 系统 评价 及 RCT 等 证 据 信息 , 在 数量 上 要 
少 于 RCT 等 原始 研究 文献 。 








可 获得 数量 
最 低 
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其 他 计量 研究 : 项 目 评估 意见 
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最 多 最 低 
图 6-1 医学 文献 与 信息 资源 分 布 金字 塔 图 


:、 阅 读 和 评价 医学 文献 的 重要 性 


(一 ) 医学 文献 与 临床 医疗 实践 二 
在 日 常 的 临床 实践 中 , 要 求 临床 医生 掌握 临床 诊治 新 技术 与 新 方法 , 离 不 开 对 医学 文献 的 二 





笔记 移 


阅读 与 评价 。 特 别 是 现在 倡导 循 证 医学 实践 , 要 求 高 素质 的 临床 医生 结合 医疗 环境 和 患者 的 主 
观 意愿 , 将 最 佳 证 据 应 用 到 具体 的 临床 实践 之 中 , 从 而 创造 一 流 的 医疗 水 平 , 更 好 地 为 提高 国 
民 健康 水 平 服务 。 最 佳 证 据 来 源 于 高 质量 的 诊断 、 防 治 、 预 后 以 及 病因 学 /危险 因素 研究 文献 。 
另外 , 随 着 病人 维权 意识 的 提高 , 病人 及 家 属 也 可 能 利用 一 些 现 成 的 检索 资源 和 检索 工具 , 查 
阅 医 学 文献 , 希望 掌握 疾病 诊治 相关 的 知识 与 信息 , 并 从 中 找 出 一 些 “证据” 主动 与 医生 探讨 。 








| 鉴于 医 患 关系 紧张 已 是 不 争 的 事实 , 这 也 迫使 临床 医生 及 时 掌握 相关 文献 信息 , 以 利于 医 患 间 


的 交流 与 沟通 , 创造 和 谐 的 医 患 关系 。 

(二 ) 医学 文献 与 临床 科研 

医学 科研 , 选 题 立 题 是 基础 。 当 今 社会 是 “知识 爆炸 ” 的 时 代 , 由 于 科技 与 信息 科学 的 高 度 
发 展 , 信息 量 本 已 十 分 庞大 , 而 新 的 海量 信息 又 源源 不 断 的 涌现 , 这 在 医学 相关 领域 表现 得 万 
为 突出 。 在 此 背景 下 , 临床 医生 担负 着 临床 医疗 与 临床 科研 的 双重 使 命 , 临床 研究 要 有 所 创 
新 , 需要 进行 大 量 的 文献 复习 , 以 掌握 最 新 的 专业 进展 与 研究 动态 , 这 也 离 不 开 对 医学 文献 的 
评阅 。 

(三 ) 医学 文献 与 医学 教育 

在 医学 教育 的 不 同 阶段 , 对 医学 文献 有 着 不 同 层次 的 需求 。 例 如 , 处 于 培训 阶段 的 临床 医 
学 生 , 对 医学 文献 阅读 、 评 价 的 需求 不 高 , 很 多 入 门 问题 已 由 专人 帮助 解决 ; 但 过 了 该 阶段 , 在 
独立 进行 临床 实践 活动 中 , 所 遇 到 一 系列 临床 问题 , 这 就 要 通过 阅读 和 评价 医学 研究 文献 , 大 
多 由 自己 加 以 解决 。 

目前 , 由 于 医疗 新 技术 与 新 方法 不 断 涌 现 , 知识 更 新 周期 明显 缩短 , 过 去 认为 是 最 佳 的 技 
术 方法 , 逐渐 被 淘汰 。 临 床 医生 要 保持 和 提高 临床 技能 水 平 , 需要 进行 终身 教育 , 不 断 学 习 与 
更 新 专业 知识 。 其 中 阅读 专业 文献 ,成 为 大 多 临床 医生 知识 更 新 的 首选 。 例 如 有 研究 表明 , 要 
维持 业务 水 平 不 落伍 , 需要 定期 阅读 大 量 专业 文献 , 以 及 时 掌握 本 学 科 新 进展 , 阅读 的 杂志 
多 , 则 越 有 可 能 追踪 到 全 部 相关 文献 。 如 果 阅 读 20 本 专业 杂志 , 基本 可 以 覆盖 80% 的 相关 文 
献 , 若 要 实现 全 覆盖 , 则 至 少 需要 订阅 60 本 专业 杂志 。 这 对 临床 医生 是 一 个 产 峻 挑战 , 为 此 ， 
只 有 学 会 正确 的 阅读 与 评价 医学 文献 , 方 能 实现 自我 终身 教育 , 使 自己 的 知识 水 平 永 葆 一 流 。 

(四 ) 医学 文献 与 卫生 决策 

卫生 政策 的 制定 同样 需要 借助 医学 文献 的 阅读 与 评价 , 以 从 中 发 现 决策 所 需 的 重要 证 据 与 
依据 。 鉴 于 卫生 服务 资源 的 有 限 性 与 医疗 卫生 服务 需求 的 无 限 性 的 矛盾 将 长 期 存在 , “看 病 难 、 
看 病 贵 "问题 日 益 突 出 , 要 实现 卫生 服务 资源 的 最 优 分 配 以 及 医疗 卫生 服务 的 效率 最 大 化 , 对 卫 
生 服务 研究 文献 以 及 卫生 经 济 学 评价 研究 文献 的 评阅 不 可 缺少 。 同 时 , 在 国家 层面 上 形成 的 重 
大 疾病 攻关 和 支撑 计划 等 决策 , 也 是 建立 在 大 量 的 文献 复习 和 调研 的 基础 之 上 的 。 通 过 阅读 医 








| 学 文献 ,可 以 更 好 地 确定 重点 疾病 与 研究 重点 , 从 而 有 针对 性 地 制定 招 投标 指南 。 此 外 , 对 于 


突 发 性 公共 卫生 事件 频 发 的 现状 , 作为 卫生 政策 决策 部 门 , 要 提前 制定 处 置 预案 , 以 防 患 于 未 
然 。 而 预案 的 规划 与 制定 , 需要 学 习 和 借鉴 类 似 事件 的 处 置 经 验 和 教训 , 同样 也 离 不 开 大 量 的 
文献 复习 。 


二 节 ”阅读 医学 文献 的 基本 步 又 


一 、 医 学 文献 检索 
文献 检索 分 为 手工 检索 和 计算 机 检索 。 随 着 计算 机 技术 和 通信 技术 的 迅猛 发 展 , 使得 计算 
机 文献 检索 得 以 广泛 应 用 , 由 于 其 检索 速度 快 .范围 广 、 内 容 新 、 检 索 入 口 多 、 功 能 强 且 用 户 使 
用 方便 , 已 成 为 医学 生 必 须 掌 握 的 关键 技能 之 一 。 











(一 ) 医学 文献 来 源 与 检索 资源 

医学 文献 具有 来 源 广 、 种 类 多 、 分 布 广泛 等 特点 , 且 有 一 定 规律 可 循 。 例 如 , 按照 文献 可 及 
的 数量 以 及 分 布 密度 顺序 排列 , 一 般 呈 现金 字 塔 状 分 布 (图 6-1 右 图 )。 其 中 电子 文献 检索 数据 
库 ( 电 子 文献 索引 或 全 文 数据 库 ), 收录 了 包括 指南 、 系 统 评价 、 临 床 原始 研究 以 及 其 他 计量 研 
究 等 绝 大 多 数 医学 研究 文献 。 目 前 常见 的 中 英文 生物 医学 文献 数据 库 中 , 主要 包括 MEDLINE 
(美国 “医学 索引 在 线 , 或 PubMed”)、Embase. 中 国生 物 医 学 文献 数据 库 (Chinese Biomedical 
Literature Database, CBM)、CNKI、VIP 等 。 当 然 一 篇 医学 文献 有 可 能 被 多 个 电子 文献 数据 库 同 
时 收录 , 在 检索 文献 时 , 可 能 被 多 次 检 出 , 需要 进行 剔 重 。 

尽管 电子 文献 数据 库 是 医学 文献 的 主要 来 源 , 但 仍 存在 一 些 不 足 。 如 大 多 只 能 收录 摘要 ， 
未 能 收录 文献 全 文 。 其 次 可 能 存在 发 表 性 偏 倚 , 阴性 结果 文献 数量 可 能 被 严重 低估 。 另 外 文献 
的 收录 也 存在 地 域 性 发 表 偏 倚 。 如 在 一 个 收录 了 3000~4000 种 杂志 的 文献 数据 库 中 , 只 有 2% 
的 文献 来 自 中 低 收入 的 发 展 中 国家 , 而 发 表 在 这 些 国家 国内 杂志 上 的 文献 超过 90% 并 没有 被 
主要 电子 检索 数据 库 收录 。 因 此 ,为 弥补 电子 文献 数据 库 的 上 述 缺 陷 , 常 利用 互联 网 (WWW ) 
查阅 一 些 灰色 文献 作为 常规 医学 文献 检索 的 重要 补充 。 灰 色 文献 是 指 由 官方 ,. NGO、 学术 机 构 
等 非 赢利 单位 出 版 发 行 的 印刷 品 和 电子 出 版 物 。 形 式 多 种 多 样 , 既 可 以 是 技术 报告 、 研 究 报告 ， 
也 可 以 是 技术 文件 、 技 术 说 明 与 标准 , 以 及 一 些 非 赢利 性 的 译文 、 著 作 、 官 方 文件 等 。 因 这 些 文 
献 信息 多 未 经 过 严格 评价 , 称 之 为 灰色 文献 。 除 此 之 外 , 互联 网 上 的 灰色 文献 还 包括 数量 庞大 
的 有 潜在 价值 的 网 页 信息 , 多 由 一 些小 的 或 不 知名 的 机 构 、 非 政府 组 织 CNGOs)、 学 术 研究 中 
心 .咨询 公司 等 创建 。 但 从 这 些 海量 的 灰色 文献 资源 中 提取 有 价值 的 信息 作为 文献 检索 的 重要 
补充 , 还 需 借 助 于 一 些 数据 挖掘 与 知识 发 现 技术 。 

(二 ) 文献 检索 基本 步骤 

无 论 是 人 工 检索 还 是 计算 机 检索 , 都 大 致 分 为 以 下 几 大 步骤 : 从 分 析 检 索 题 目 入 手 . 明确 
检索 要 求 ; 进而 选择 检索 工具 , 制定 检索 策略 。 如 一 般 将 那些 文献 类 型 全 、 数 量 大 、 时 差 短 、 途 
径 多 、 著 录 标 准 的 检索 工具 作为 首选 ; 最 后 选择 检索 途径 , 检索 并 获取 原始 文献 。 

1. 检索 问题 的 提出 ”围绕 研究 目的 ,将 特定 的 研究 问题 进行 规范 化 和 标准 化 , 形成 结构 化 
检索 问题 , 进而 按照 PICOS 原则 解析 后 , 制定 检索 策略 , 进而 选择 检索 数据 库 , 系统 检索 文献 。 
根据 PICOS 原则 , 检索 问题 一 般 可 解析 为 以 下 5 大 要 素 : 

“P" : 为 patient( 病 人 ) 或 population( 群体) 的 缩写 , 表示 他 (她 ) 或 他 们 患 的 是 什么 病 、 存 在 什 
么 需要 解决 的 临床 问题 。 

“1”; 为 intervention( 干 预 措施 ) 的 缩写 , 表示 针对 病人 存在 的 临床 问题 , 拟 探求 的 干预 措施 
是 什么 ? 

“C" : 为 comparison( 比较 ) 的 缩写 , 表示 设置 的 对 照 比较 措施 是 什么 ? 如 安慰 剂 或 其 阳性 对 
照 等 。 

“0": 为 outcome( 结果 ) 的 缩写 , 表示 与 干预 措施 相关 的 最 终结 局 是 什么 ”如 不 良 事件 发 生 
率 、 病 死 率 等 。 

“S”: 为 study( 研 究 类 型 ) 的 缩写 , 表示 具体 的 研究 设计 方案 是 什么 ”如 原始 研究 类 型 主要 
包括 随机 对 照 临床 试验 、 交 叉 试验 、 非 随机 同期 对 照 试验 队列 研究 、 前 -后 对 照 研究 .病例 对 
照 研 究 .病例 系列 或 报告 等 。 

由 于 检索 问题 各 具 特 点 ,检索 者 不 一 定 将 关注 的 问题 均 解析 为 上 述 5 项 , 也 许 只 需 2~3 项 
即 可 ,但 上 述 5 要素 的 解析 思路 , 有 利于 检索 者 形成 一 个 完整 的 检索 路 径 。 

2. 制定 检索 策略 ”检索 策略 (search strategy ) 是 指 在 解析 相关 问题 的 基础 上 , 结合 检索 目 
的 和 信息 需求, 选择 检索 系统 , 确定 检索 词 , 构造 检索 式 , 从 而 制订 出 较为 完善 的 检索 计划 或 
方案 。 
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其 中 构造 检索 式 需要 使 用 检索 系统 规定 或 允许 的 符号 (运算 符 ), 并 用 于 连接 已 确定 的 检索 
词 。 检 索 系统 中 的 运算 符 有 位 置 运算 符 、 逻 辑 运算 符 、 限制 运算 符 、 截 词 符 等 。 常 使 用 的 逻辑 运 
算 符 有 : D “AND"”( 逻 辑 “与 " ): 其 作用 为 缩小 检索 范围 , 提高 查 准 率 ; @“OR"( 罗 和 辑 或 " ): 其 作 
用 为 扩大 检索 范围 ,提高 查 全 率 ; @“NOT" (逻辑 二 E" ): 其 作用 为 缩小 检索 范围 , 提高 查 准 率 。 

3. 选择 检索 数据 库 、 系 统 检索 文献 ”选择 检索 数据 库 , 确定 检索 方法 。 一 般 将 那些 文献 类 
型 全 、 数 量 大 、 时 差 短 、 途 径 多 、 著 录 标准 的 检索 数据 库 作为 首选 ; 同时 为 提高 检索 效率 , 在 检索 
内 容 与 顺序 安排 上 , 有 一 定 的 讲究 。 一 般 是 先 寻 找 可 靠 的 三 次 文献 , 如 指南 、 系 统 评价 等 , 这 些 
文献 综合 了 大 量 相 关 的 原始 研究 结果 , 且 经 过 了 加 工 和 提炼 。 若 无 这 样 现成 的 文献 ,再 寻找 可 




















靠 的 原始 研究 文献 。 
开始 使 用 电子 文献 数据 库 时 , 最 好 寻求 图 书 管理 员 的 帮助 , 以 尽快 熟悉 检索 方法 , 提高 检 
索 效 率 。 


二 、 阅 读 医学 文献 的 基本 步 又 
医学 研究 文献 具有 两 种 属性 , 一 是 外 部 特征 , 比如 题目 、 作 者 、 作 者 单位 、 发 表 期 刊 、 卷 、 
期 、 页 码 、 年 限 \ 语 种 等 ,这 些 信息 由 于 具有 唯一 性 和 指向 性 的 特点 , 常 被 用 来 标识 文献 , 供 文 
献 的 收集 、 整 理 、 存 储 、 传 播 与 查询 之 用 ; 二 是 内 部 特征 , 包括 研究 目的 、 科 学 假设 、 设 计 、 研 究 
方法 、 研 究 对 象 、 主 要 结果 、 讨 论 和 结论 等 方面 内 容 , 既是 文献 的 核心 , 又 是 文献 阅读 的 重点 
(图 6-2)。 








无 关 、 不 重要 
文献 检索 与 筛选 剔除 文献 


| 文献 分 类 闽 理 : 浏览 本 要 、 前言 区 除 文献 


| 区 到 无 关 、 不 重要 


| 条 计 滴 要 、 前 言 EX 了 | 一 





















摘录 精粹 与 汇总 
效果 评价 与 小 结 


6-2 文献 阅读 的 基本 流程 图 









(一 ) 结合 阅读 文献 的 目的 , 筛选 、 甄 别 、 获 取 相关 医学 研究 文献 
开始 阅读 之 前 , 一 定 要 弄 清 楚 “为 什么 要 阅读 文献 ?”“ 要 阅读 哪些 文献 ?” 带 着 问题 有 针对 
性 地 筛选 、 甄 别 、 获 取 医 学 研究 文献 。 筛 选 文献 不 能 无 的 放 失 , 根据 具体 问题 , 一般 先 从 阅读 文 
献 摘 要 入 手 , 按照 与 阅读 目的 的 关联 性 大 小 以 及 文献 的 时 效 性 , 依次 安排 文献 阅读 的 先后 顺序 ， 
从 中 六 选 出 最 新 、 关 联 程度 最 高 的 文献 , 进而 阅读 全 文 。 这 一 点 对 提高 阅读 效率 尤为 重要 。 鉴 
| 区 于 候选 文献 中 的 摘要 , 无 论 是 结构 式 摘要 抑或 非 结构 式 摘要 , 提供 的 信息 量 有 限 , 有 时 难以 取 
笔记 ZY 舍 , 需要 进一步 获取 全 文 , 以 确认 是 否 最 终 纳入 。 








(二 ) 熟悉 文献 的 基本 结构 、 选 择 阅读 方式 和 阅读 重点 

对 于 纳入 的 文献 , 应 首先 熬 悉 其 基本 结构 , 确定 阅读 重点 。 因 个 人 精力 和 时 间 有 限 , 最 好 
在 正式 阅读 开始 之 前 ,对 检索 到 的 文献 进行 分 类 和 整理 ,根据 个 人 精力 、 时 间 以 及 与 个 人 关注 
问题 的 密切 程度 ,将 纳入 文献 分 为 : 精读 文献 和 泛 读 文献 。 如 , 对 于 与 个 人 关注 问题 密切 相关 
的 文献 可 采用 选择 性 精读 文献 的 方法 ; 而 对 于 与 个 人 关注 问题 关系 不 密切 的 文献 可 以 采用 泛 读 
的 方法 进行 。 在 医学 研究 领域 中 , 重要 文献 是 指 那些 对 学 科 发 展 具有 里 程 碑 意义 的 原始 研究 文 
献 以 及 学 术 权 威 撰写 的 综述 或 述评 等 。 对 此 类 文献 应 设法 获取 全 文 并 仔细 阅读 。 其 他 文献 以 
泛 读 为 主 , 先 阅读 题目 、 摘 要 , 在 此 过 程 中 , 若 发 现 文献 有 价值 可 升格 为 重要 文献 ,再 精读 全 文 。 
车 同类 文献 较 多 时 ,考虑 精读 文献 的 顺序 ,新 近 且 重要 的 文献 , 优先 进行 精读 。 

一 篇 完整 的 原始 研究 文献 一 般 包 括 摘要 前言、 材料 和 方法 (或 对 象 和 方法 )、 结 果 、 讨 论 
(包括 结论 ) 和 参考 文献 六 部 分 。 阅 读 目 的 不 同 ,对 同一 篇 文献 的 阅读 重点 有 所 侧重 。 如 果 想 了 
解 该 文献 的 结论 是 否 适合 于 自己 的 病人 , 可 直接 阅读 “材料 和 方法 "部 分 了 解 其 设计 方案 、 病 例 
的 选择 标准 等 以 判断 其 结论 的 应 用 范围, 无 需 从 头 读 到 尾 。 若 为 了 解 学 科 新 进展 , 应 重点 阅读 
文献 的 “结果 和 结论 "部 分 ; 若 为 启迪 研究 思路 , 则 应 以 文献 的 研究 方法 为 阅读 重点 , 可 取 长 补 
短 、 突 破 固有 思维 模式 , 发 现 创新 点 ; 车 为 临床 科研 的 选 题 及 立 题 提出 依据 , 先 阅读 文献 的 “前 
言 "部 分 , 掌握 该 研究 领域 的 历史 与 现状 , 同时 在 该 文献 “讨论 "部 分 查找 不 足 之 处 、 方 法 学 缺陷 
等 , 这 些 就 是 将 来 的 研究 方向 与 创新 点 。 

(三 ) 阅读 文献 、 摘 录 文献 精粹 

对 纳入 的 文献 , 即使 一 篇 与 自己 研究 目的 高 度 相关 的 文献 ,也 不 可 能 全 盘 照 报 , 需要 从 中 
摘录 出 精粹 部 分 , 可 以 是 文献 中 的 某 段 话 、 某 种 方法 ,也 可 能 是 一 幅 图 表 等 , 宜 精 不 宜 多 , 过 多 
内 容 会 显得 杂乱 无 章 , 对 初学 者 无 益 。 在 摘录 文献 精粹 的 基础 上 , 进一步 加 以 系统 总 结 。 逐 一 
将 文献 的 精粹 部 分 ,加 以 汇总 ; 为 方便 管理 ,需要 创立 一 个 文档 文件 ,将 相关 内 容 作 长 久保 存 。 
同时 , 在 汇总 过 程 中 , 最 好 能 将 文献 的 读后感 ,包括 阅读 后 有 哪些 收获 、 新 启发 、 新 思路 等 提 炼 
加 工 后 , 一 并 纳入 。 

一 般 的 文献 泛 读 可 以 在 5-15 分 钟 内 完成 ,精读 文献 则 需要 2 小 时 到 1 周 时 间 不 等 。 相 对 
文献 泛 读 , 精读 文献 时 需要 摘录 的 文献 信息 更 为 全 面 细致。 特别 是 应 弄 清 以 下 基本 问题 : 

1. 研究 目的 是 什么 “通过 阅读 前 言 部 分 , 明确 该 文献 的 科学 假设、 拟 解决 的 关键 问题 、 立 
题 背景 和 依据 是 否 充分 等。 

2. 研究 方法 与 研究 对 象 是 什么 “在 这 部 分 ,需要 了 解 具体 的 研究 设计 方案 研究 方 法 是 否 
新 颖 合理 .样本 来 源 与 样本 大 小 如 何 、 设 置 哪些 测量 指标 以 及 指标 的 实际 价值 和 意义 如 何 ? 

3. 主要 结果 和 重要 发 现 有 了 哪些。 全面 熟 悉 文 献 的 主要 结果 , 明确 文中 的 新 发 现 、 新 贡献 ， 
用 于 结果 报告 的 重要 图 表 有 哪些 ? 

4. 讨论 与 结论 文献 的 结论 是 什么 ? 该 文 的 主要 结果 是 否 支持 这 些 结论 ? 文中 的 立 题 、 
设计 .方法 和 讨论 间 是 否 有 内 在 的 迎 辑 关系 ? 研究 目的 是 否 实现 ”主要 不 足 有 哪些 ? 还 遗留 有 
哪些 问题 未 解决 ? 

5. 小 结 “精读 后 , 最 好 能 加 以 小 结 。 如 与 同类 文献 相 比 , 该 文献 有 什么 共同 点 和 不 同 点 ? 
作者 的 整体 思路 有 无 创新 之 处 ?必要 时 ,可 进行 类 似 SWOT 分 析 , 找 出 优势 和 不 足 。 


第 三 节 ”医学 研究 文献 的 评价 要 素 与 方法 


一 、 确 定 医 学 研究 文献 评价 的 范畴 和 内 容 
评价 文献 时 同样 需要 带 着 问题 , 有 针对 性 地 进行 。 评 价目 的 不 同 , 决定 了 评价 范畴 和 重点 。 





如 了 《 
笃 所 ‘4 
> 多 
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文献 质量 评价 涉及 两 个 方面 的 内 容 , 即 报告 质量 和 方法 学 质量 。 其 中 报告 质量 是 指 文献 报告 内 
容 的 全 面 性 和 完整 性 以 及 和 相应 报告 规范 的 符合 程度 。 方 法 学 质量 是 指 文献 制作 过 程 中 遵循 科 
学 标准 、 有 效 控制 混杂 与 偏 倚 、 使 研究 结果 达到 真实 可 靠 的 程度 , 为 文献 质量 评价 的 核心 内 容 。 

鉴于 评价 往往 具有 很 强 的 主观 性 , 受 评价 者 自身 能 力 与 水 平 的 限制 , 同一 篇 文献 , 其 评价 
结果 有 可 能 存在 较 大 出 人 。 因 此 ,文献 评价 方法 的 选择 以 及 评价 过 程 是 否 规范 透明 , 尤为 重要 。 
临床 流行 病 学 作为 临床 医学 的 一 门 基础 学 科 , 强调 应 用 科学 的 方法 学 强化 临床 科研 设计 、 排 除 
各 种 偏 倚 、 混 杂 因素 的 影响 , 确保 研究 结果 的 真实 性 和 研究 结论 的 可 靠 性 , 使 得 科学 研究 获得 
的 成 果 能 够 用 于 指导 临床 实践 .教学 与 科研 。 因 此 , 临床 流行 病 学 的 相关 质量 标准 已 成 为 质量 
评价 的 参考 依据 , 并 在 国际 上 获得 公认 。 因 此 , 为 保证 评价 质量 , 评价 者 应 学 习 和 掌握 临床 流 
行 病 学 中 有 关 研 究 设计 、 测 量 与 评价 的 基本 原则 和 方法 , 有 助 于 培养 批判 性 思维 能 力 。 

评价 内 容 主要 包括 真实 性 评价 、 重 要 性 评价 及 适用 性 评价 , 用 以 依次 回答 下 列 问题 : 该 研 
究 结果 本 身 是 否 真实 可 靠 ” 有 多 大 临床 意义 和 实用 价值 ? 用 于 临床 实践 的 可 行 性 及 适用 程度 
如 何 ? 其 中 研究 结果 的 真实 性 和 重要 性 是 评价 的 重点 , 只 有 真实 、 可靠、 重要 的 研究 结果 才 有 
利用 价值 。 


二 、 评 价 医学 研究 文献 的 一 般 原则 

阅读 医学 研究 文献 的 目的 , 主要 是 回答 “what” 类 问题 , 以 全 面 了 解 该 文献 中 的 研究 目的 、 
对 象 、 研 究 方法 、 主 要 结果 和 重要 结论 等 内 容 ; 而 评价 医学 研究 文献 ， 则 是 回答 “why” 类 问题 ， 
一 般 选 在 二 轮 精读 时 进行 ,要 求 评价 者 具备 批判 性 思维 并 掌握 一 定 的 评价 原则 与 方法 。 

(一 ) 真实 性 评价 原则 

评价 真实 性 的 关键 ， 在 于 考核 研究 过 程 中 是 否 有 效 控制 了 混杂 与 偏 倚 对 结果 的 影响 。 这 些 
因素 对 结果 的 影响 大 小 决定 了 真实 性 的 程度 。 因 此 ， 评价 真实 性 应 综合 考虑 研究 结果 是 来 自 何 
种 设计 方案 ` 有 无 对 照 组 以 及 设置 是 否 恰当 、 研究 对 象 的 诊断 标准 是 否 可 靠 `、 纳 入 / 排除 标准 如 
何 、 样 本 量 是 否 足够 .组 间 重 要 的 基线 状况 是 否 可 比 、 有 无 相关 偏 倚 因 素 存 在 以 及 是 否 采取 了 
相应 的 防止 或 处 理 的 措施 、 依 从 性 如 何 、 对 相应 的 试验 观测 指标 及 资料 所 采用 的 整理 、 统 计 分 
析 方 法 是 否 恰当 等 。 如 针对 定量 研究 文献 , JAMA 用 户 指导 手册 中 专门 制定 了 5 项 指导 性 评价 
原则 : 中 研究 对 象 是 否 与 研究 问题 有 关 ? @ 研 究 对 象 的 选择 是 否 有 充足 的 理由 ? @ 数 据 资料 的 
收集 方法 是 否 与 研究 目的 与 场所 匹配 ? @ 数 据 资料 的 收集 是 否 完整 充分 `\ 足 以 描述 观察 事件 ? 
@ 资 料 的 分 析 是 否 合适 以 及 发 现 的 结果 是 否 被 充分 证 实 ? 等 等 。 这 5 项 原则 对 一 般 定量 研究 
文献 的 评价 均 有 一 定 的 参考 价值 。 

(二 ) 重要 性 评价 原则 

评价 临床 研究 结果 的 重要 性 常 借助 于 一 些 定性 或 定量 指标 。 如 在 临床 试验 中 , 定性 指标 有 
事件 发 生 率 ( 如 病死 率 、 生 存 率 、 治 愈 率 …… )、 绝 对 危险 降低 率 (absolute risk reduction, 4RR)、 绝 
对 获 益 增加 率 (absolute benefit inerease, ABI)、 相 对 危险 度 降低 率 (relative risk reduction, RRR)、 相 
对 获 益 增加 率 (relative benefit increase, RB7)， 需 治疗 多 少 例 患 者 才能 获得 一 例 最 佳 效 果 ( number 
needed to treat, NNT) 以 及 需 治疗 多 少 例 患 者 才能 发 现 一 例 不 良 反应 (number needed to harm, NNH， 
等 。 对 于 定量 指标 , 则 较为 单一 , 主要 计算 组 间 均 数 差 值 。 重 要 性 包括 临床 重要 性 与 统计 学 意 
义 两 个 方面 ,两 者 应 相互 结合 , 作 综 合 评价 。 统 计 学 意义 的 判定 可 以 通过 假设 检验 和 区 间 估 计 
加 以 实现 。 若 假设 检验 的 己 值 小 于 预先 设置 的 检验 水 准 (常设 为 0.05), 则 可 认为 组 间 差 异 有 
统计 学 意义 。 这 里 要 强调 的 是 组 间 差 值 的 大 小 与 P 值 无 必然 联系 ,假如 组 间 差 值 无 临床 意义 ， 
尸 值 再 小 , 也 无 临床 应 用 价值 。 当 某 种 研究 结果 既 有 临床 意义 , 又 有 统计 学 意义 时 , 即 能 作出 肯 
定性 的 结论 ; 如 仅 有 临床 意义 而 无 统计 学 意义 时 , 不 能 盲目 否定 其 临床 价值 , 应 计算 型 错误 率 
或 检验 效能 加 以 核实 ; 若 文献 结果 既 无 临床 意义 , 又 无 统计 学 意义 , 则 此 类 文献 的 重要 性 可 和 忽 
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略 。 临 床 重要 性 的 判断 , 还 应 做 卫生 经 济 学 的 评价 , 进行 成 本 - 效果 (cost-effectiveness)、 成 本 - 
效益 (cost-benefit) 以 及 成 本 - 效用 (cost-utility ) 分 析 I 使 那些 成 本 低 、 效果 佳 的 研究 成 果 , 得 以 推 
广 应 用 。 

(三 ) 适用 性 评价 

适用 性 评价 同样 需要 结合 阅读 文献 的 目的 ， 是 为 了 指导 临床 实践 、 教 学 , 还 是 为 临床 科研 
所 用 。 车 将 上 述 真实 性 好 且 有 重要 临床 价值 的 文献 结果 在 临床 实践 中 加 以 应 用 和 推广 , 应 结 
合 自己 病人 的 实际 病 况 和 接受 程度 、 现 有 医疗 条 件 和 知识 技能 水 平 ， 以 及 社会 经 济 状况 的 承受 
能 力 等 , 对 其 临床 适用 性 展开 评价 。 鉴于 当前 高 质量 的 临床 研究 文献 多 来 源 于 发 达 国 家 ， 而 由 
于 人 种 、 社 会 环境 、 经 济 水 平 、 医疗 条 件 乃 至 生物 因素 在 国家 层面 上 差异 较 大 。 因此 ,评价 适用 
性 , 更 要 结合 不 同 的 国情 、 种 族 以 及 病人 特点 ， 切 不 可 生 搬 硬 套 。 要 对 具体 的 问题 作 具 体 的 分 
析 , 方 可 作出 是 否 适用 的 决策 。 

车 在 临床 科研 、 教 学 过 程 中 ， 为 掌握 学 科 最 新 进展 或 发 展 方向 、 拓 展 新 思路 、 新 视野 之 用 ， 
也 要 进行 适用 性 评价 ， 对 文献 结果 是 否 具有 外 部 真实 性 ， 即 能 否 将 结果 推广 应 用 到 研究 对 象 以 
外 的 群体 或 环境 时 ， 应 考核 研究 人 群 与 其 他 人 群 的 特征 差异 、 研究 对 象 类 型 以 及 社会 环境 和 经 
济 等 因素 是 否 会 影响 适用 性 等 。 

三 、 临 床 研究 类 型 及 其 评价 工具 的 合理 选择 

为 方便 评价 , 针对 不 同 研究 类 型 ， 已 有 一 些 现成 的 严格 评价 工具 或 标准 , 可 供 参考 借鉴 。 
评价 工具 大 多 由 一 些 知名 学 术 机 构 或 组 织 研发 。 例 如 JAMA 发 布 的 用 户 指导 手册 系列 、CASP 
严格 评价 技巧 项 目 网 提供 的 系列 质量 评价 标准 等 ， 专门 用 于 评估 包括 系统 评价 、 随 机 对 照 试验 、 
病例 对 照 研究 、 队 列 研究 、 描 述 性 研究 、 诊断 试验 和 经 济 学 评价 研究 等 在 内 的 不 同类 型 文献 。 
评价 工具 可 分 为 清单 类 ( checklist ) 和 尺度 评分 类 (scale ) 两 种 。 

不 同 的 研究 设计 , 其 科学 论证 强度 不 同 ， 评价 方法 及 评价 工具 也 有 所 不 同 。 

1. 原始 研究 评价 工具 ”以 随机 对 照 试 验 的 评价 工具 最 为 多 见 。 由 于 随机 对 照 试 验 采用 了 随 
机 、 育 法 以 及 设置 对 照 组 , 最 大 限度 地 控制 了 混杂 和 偏 倚 对 结果 的 影响 ， 确保 了 结果 的 真实 性 ， 
被 认为 是 一 种 论证 强度 较 高 的 设计 方案 ， 因而 在 临床 研究 中 备 受 推崇 , 相关 文献 发 表 也 很 多 ， 成 
为 临床 证 据 的 重要 来 源 ， 相应 的 质量 评价 方法 也 发 展 很 快 。 报 告 质量 的 评价 可 借助 于 CONSORT 
( Consolidated Standards of Reporting Trials ), 方 法 学 质量 评价 可 选择 的 工具 比较 多 ， 如 Cochrane 手 
册 中 的 偏 傈 风险 评价 工具 , Jadad 评分 等 ; 对 于 观察 性 研究 (包括 队列 研究 、 病 例 对 照 研究 等 )， 报 
告 质量 评价 可 以 选择 STROBE( Strengthening the Reporting of Observational Studies in Epidemiology, 
STROBE ), 方法 学 质量 评价 工具 也 比较 多 , 常见 有 CASP 工具 ( Critical Appraisal Skills Programme， 
CASP) 和 NOS 评 分 (The Newcastle-Ottawa Scale， NOS) 等 。 

2. 二 次 研究 评价 工具 ”对 二 次 研究 文献 可 评价 其 方法 学 质量 以 及 报告 质量 。 如 评价 系统 
评价 的 方法 学 质量 工具 有 0QAQ、AMSTAR 等 ; 有关 报告 质量 评价 工具 有 QUOROM 及 其 升级 版 
(PRISMA ) 等 。 其 中 , PRISMA 是 用 来 规范 系统 评价 的 一 种 标准 报告 格式 ,包括 27 个 条 目 ， 覆盖 
了 系统 评价 中 的 摘要 、 简 介 方法 与 结果 等 方面 内 容 ， 可 用 来 与 一 篇 系统 评价 内 容 逐 一 进行 比 
对 ,考核 其 报告 内 容 是 否 完整 。 

(康德 英 ) 
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随 着 医学 科学 日 新 月 异 的 发 展 、 研 究 新 领域 的 日 趋 开拓 、 人 们 认识 的 不 断 深化 , 临床 医学 
研究 层出不穷 , 为 决策 者 提供 了 大 量 科学 信息 。 医务 人 员 和 研究 者 为 了 获得 新 知识 、 新 观点 和 
新 技术 以 扩展 视野 , 提高 学 术 水 平 ， 需要 阅读 大 量 文献 。 但 现 有 临床 研究 多 数 规模 较 小 , 纳入 
研究 对 象 数量 有 限 , 针对 同一 种 疾病 的 同一 或 同类 干预 措施 的 文献 资料 有 时 数量 较 多 , 质量 良 
著 不 齐 , 结论 也 不 尽 一 致 。 如 何 从 浩如烟海 的 医学 文献 信息 中 快速 、 高 效率 地 获得 所 需 资 料 ， 
以 进行 科学 决策 ,已 成 为 我 们 面临 的 巨大 挑战 。 这 就 需要 有 一 种 方法 、 一 种 标准 将 全 面 、 系统 
收集 起 来 的 文献 , 去 粗 取 精 、 去 伪 存 真 、 综合 分 析 , 从 而 得 出 一 个 真实 性 及 可 信 性 较 高 的 结论 ， 
以 供 读者 参考 应 用 , 这 就 称 为 文献 综述 ; 如 针对 某 一 具体 临床 问题 , 采用 一 套 规范 、 科学 的 方法 
全 面 收 集 、 认 真 选择 、 产 格 评价 和 科学 分 析 相 关 研 究 资料 , 得 出 综合 可 靠 的 结论 , 此 乃 系统 评价 
(systematic review 廊 

临床 医生 工作 繁忙 ， 要 想 为 解决 一 个 临床 问题 , 去 查 遍 相关 文献 并 进行 综合 评价 , 难度 很 
大 , 可 是 ， 假如 您 面 对 一 个 实际 问题 需要 您 科学 回答 , 这 就 是 挑战 : 如 一 个 妇 产 科 医 生 , 面 对 有 
早产 危险 的 孕妇 ， 而 早产 婴儿 往往 有 可 能 胎 内 发 育 不 全 , 特别 是 因 肺 发 育 未 成 熟 , 死亡 率 和 呼 
吸 容 迫 综 合 征 的 发 生 率 都 非常 高 。 有 专家 提出 ,如 果 对 可 能 早产 的 孕妇 使 用 激素 , 可 促进 胎儿 
的 肺 发 育 。 为 了 明确 对 可 能 早产 孕妇 使 用 激素 后 是 否 能 减少 早产 儿 的 死亡 率 和 呼吸 窒 迫 综合 
征 的 发 生 率 , 你 查寻 了 有 关 资 料 , 发 现 有 7 个 高 质量 的 随机 对 照 试 验 , 其 中 5 个 试验 结果 为 阴性 
《使 用 激素 后 未 能 减少 早产 儿 的 死亡 率 和 呼吸 寨 迫 综合 征 的 发 生 率 )， 2 个 试验 结果 为 阳性 , 你 将 
作 何 决策 呢 ? 科学 回答 这 个 问题 就 需要 对 这 7 篇 文献 进行 系统 评价 , 以 助 自己 的 科学 决策 

因此 , 本章 将 重点 阐述 系统 评价 及 meta 分 析 的 方法 及 其 相关 的 质量 分 析 和 评价 原则 , 以 供 
读者 回答 这 一 挑战 的 参考 和 应 用 。 


第 一 节 ”系统 评价 概述 


一 .基本 概念 

(一 ) 系统 评价 eh 

系统 评价 是 一 种 全 新 的 文献 综合 方法 , 指针 对 某 一 具体 临床 问题 ( 如 疾病 的 病因 、 诊断 、 治 
疗 、 预 后 ), 系统 、 全 面 地 收集 现 有 已 发 表 或 未 发 表 的 临床 研究 ， 采用 临床 流行 病 学 严格 评价 广 
献 的 原则 和 方法 , 逢 选 出 符合 质量 标准 的 文献 , 进行 定性 或 定量 合成 (meta-analysis, meta 分 析 址 
至 茜 分 析 ), 得 出 可 靠 的 综合 结论 。 系 统 评价 可 以 是 定性 的 (定性 系统 评价 , qualitative systematic 
review), 也 可 以 是 定量 的 ( 定量 系统 评价 , quantitative systematic review ) 即 包含 meta 分 析 过 程 ， 
系统 评价 的 整个 过 程 非常 明确 , 使 其 具有 独特 的 优点 一 良好 的 重复 性 。 

系统 评价 可 为 某 一 领域 和 专业 提供 大 量 的 新 信息 和 新 知识 , 多 数 是 可 信 的 。 但 是 ， 由 于 是 
对 原始 文献 的 二 次 综合 分 析 和 评价 , 受 原 始 研究 文献 的 质量 、 系统 评价 的 方法 及 评价 者 本 人 的 
专业 知识 ,认识 水 平和 观点 等 的 制约 , 因此 , 读者 在 阅读 系统 评价 的 观点 和 结论 时 , 一 定 要 持 冲 
慎 的 态度 , 不 能 盲目 被 动 地 接受 。 

(二 ) Cochrane 系统 评价 
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handbook ), 在 相应 Cochrane 评价 小 组 编辑 部 的 指导 和 帮助 下 所 完成 的 系统 评价 。 由 于 Cochrane 
协作 网 有 严密 的 组 织 管理 和 质量 控制 系统 , 严格 遵循 Cochrane 系统 评价 者 手册 , 采用 固定 的 格 
式 和 内 容 要 求 , 统一 的 系统 评价 软件 (Review Manager, RevMan ) 录 入 和 分 析 数据 、 扎 写 系统 评价 
计划 书 和 报告 ， 发 表 后 根据 新 的 研究 定期 更 新 , 有 着 完善 的 反馈 和 完善 机 制 ， 因此 Cochrane 系 
统 评价 的 质量 通常 比 非 Cochrane 系统 评价 质量 更 高 , 被 认为 是 单一 的 、 评价 干预 措施 疗效 的 最 
好 证 据 资 源 (best single source)。 

目前 , Cochrane 系统 评价 主要 针对 研究 疾病 防治 、 康复 疗效 和 安全 性 的 随机 对 照 试 验 进行 
评价 , 其 方法 较 完善 和 规范 ， 诊断 性 试验 的 系统 评价 已 开始 进行 。 

(三 ) meta 分 析 (meta-analysis) 

meta 分 析 由 心理 学 家 Glass 1976 年 首次 命名 ， 国内 翻译 为 苓 蘑 分 析 、 汇 总 分 析 。 就 其 定义 
目前 仍然 存在 不 同 的 争议 。Huque 及 多 数 专家 认为 : "meta 分 析 是 一 种 统计 分 析 方法 , 它 将 多 个 
独立 的 、 可 以 合成 的 临床 研究 综合 起 来 进行 定量 分 析 。 因此 ， 如 果 没 有 明确 、 科 学 的 方法 去 收 
集 、 选 择 、 评 价 临床 研究 资料 ， 而 仅 单纯 采用 统计 方法 将 多 个 临床 研究 进行 合成 并 不 能 保证 结 
论 的 真实 性 和 可 靠 性 。 

目前 系统 评价 与 meta 分 析 两 个 名 词 常 被 混用 ， 但 系统 评价 不 一 定 都 包括 有 meta 分 析 过 程 ， 
而 meta 分 析 也 不 一 定 是 系统 评价 。 

(四 ) 文献 综述 (review) 

文献 综述 又 称 为 叙述 性 文献 综述 (narrative review ) 或 传统 文献 综述 (traditional review), 由 作 
者 根据 特定 的 目的 和 需要 或 兴趣 , 围绕 某 一 题目 收集 相关 的 医学 文献 ， 采用 定性 分 析 的 方法 ， 
对 论文 的 研究 目的 、 方 法 、 结 果 、 结 论 和 观点 等 进行 分 析 和 评价 , 结合 自 己 的 观点 和 临床 经 验 加 
以 阐述 和 评论 , 总 结 成 文 , 可 为 某 一 领域 或 专业 提供 大 量 的 新 知识 和 新 进展 ， 以 便 读 者 在 较 短 
时 间 内 了 解 某 一 专题 的 研究 概况 和 发 展 方向 , 解决 临床 实践 中 遇 到 的 问题 。 但 这 种 传统 的 文献 
综述 , 往往 受 综述 者 主观 思维 以 及 某 些 选择 及 测量 性 偏 倚 的 影响 。 故 在 接受 或 应 用 这 类 证 据 
时 , 宜 持 谨慎 态度 。 








二 、 为 什么 要 进行 系统 评价 

作为 一 种 重要 的 科研 方法 , 进行 系统 评价 (systematic review), 有 其 一 定 的 必然 性 : 

(一 ) 应 对 信息 时 代 的 挑战 

每 年 约 有 200 万 篇 生物 医学 文献 发 表 在 2 万 多 种 生物 医学 杂志 上 ,年 增长 率 约 为 6.7%。 一 
个 内 科 医 师 需要 每 天 不 间断 地 阅读 19 篇 专业 文献 才能 勉强 掌握 本 学 科 的 新 进展 、 新 研究 结果 ， 
使 得 需要 大 量 信息 进行 科学 决策 的 临床 医生 、 研 究 人 员 和 卫生 部 门 的 决策 者 往往 陷 人 难以 驾驭 
的 信息 海洋 之 中 。 而 系统 评价 采用 严格 的 选择 、 评 价 方法 , 去 粗 取 精 、 去 伪 存 真 , 将 真实 、 可 靠 
而 有 临床 应 用 价值 的 信息 进行 合成 , 可 直接 为 各 层次 的 决策 者 提供 科学 依据 。 

(二 ) 及 时 转化 和 应 用 研究 成 果 

由 于 疾病 谱 的 变化 , 对 多 因素 疾病 如 恶性 肿瘤 、 心 脑 血管 疾病 和 各 种 慢性 疾病 的 治疗 方法 
的 评估 , 需要 尽量 开展 大 样本 临床 试验 , 特别 是 随机 对 照 试验 (RCT)。 但 实施 大 规模 的 RCT 需 
要 消耗 大 量 的 人 力 、 财 力 和 时 间 , 往往 超过 一 个 单位 的 承受 能 力 , 可 行 性 受 一 定 的 限制 。 而 现 
有 的 临床 研究 虽然 数量 多 , 但 多 数 样本 量 不 够 大 , 故 单个 试验 的 结果 难以 提供 较为 全 面 、 准确 
和 推广 应 用 价值 大 的 研究 结果 。 

因此 , 将 多 个 质量 较 高 的 同 质 临床 试验 结果 应 用 系统 评价 方法 进行 合成 ， 则 可 将 其 综合 
的 有 效 措施 , 及 时 转化 和 应 用 于 临床 实践 与 决策 。 如 采用 累积 性 meta 分 析 回顾 性 分 析 有 关 静 
脉 链 激 酶 治疗 急性 心肌 梗死 的 临床 试验 , 1973 年 前 发 表 的 8 个 RCTs(2432 例 患 者 ) 的 meta 分 
桥 即 证 明 静 脉 链 激酶 能 有 效 降低 AMI 患者 的 总 死亡 率 (P= 0.01); 1978 年 前 发 表 的 25 个 RCTs 
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(34542 例 患 者 ) 的 meta 分 析 , P=0.001( 包 括 GISSI-1 和 ISIS-2), 到 1986 年 ,P=0.0001, 但 静脉 
链 激酶 直至 1987 年 才 在 传统 综述 和 教科 书 中 推荐 常规 用 于 治疗 急性 心肌 梗死 。 可 见 , 临床 上 
整整 晚 了 14 年 才 开始 应 用 meta 分 析 结果 , 这 期 间 如 早 用 , 则 可 挽救 多 少 急性 心肌 梗死 患者 的 


生命 。 所 以 , Murphy 等 在 1994 年 指出 : 1973 年 以 后 的 大 型 临床 试验 , 如 果 无 医德 问题 , 也 是 多 
余 的 , 上 且 花费 大 量 经 费 。 

(三 ) 提高 统计 效能 

针对 同一 临床 问题 的 研究 非常 多 ， 但 因 疾 病 诊断 标准 、 纳 入 研究 对 象 的 标准 、 测 量 结果 方 
法 、 治 疗 措施 和 研究 设计 等 的 差异 ， 结果 可 能 不 一 致 , 甚至 相互 矛盾 。 如 对 可 能 早产 的 孕妇 使 
用 激素 的 例子 , 纳入 的 7 个 高 质量 临床 试验 , 尽管 只 有 两 个 试验 结果 有 统计 学 意义 , 但 对 7 个 临 “ 
床 试验 进行 定量 系统 评价 后 ， 样本 含量 和 统计 效能 得 以 增加 , 合并 效应 量变 得 有 统计 学 意义 ， 
即 肯定 了 糖 皮质 激素 能 有 效 降 低 早 产儿 的 病死 率 。 系统 评价 或 meta 分 析 在 进行 资料 合成 时 ， 
不 是 根据 阴性 或 阳性 研究 的 个 数 多 少 来 决定 哪 种 治疗 措施 有 效 ， 而 是 综合 考虑 了 各 个 研究 的 样 
本 量 大 小 及 其 研究 质量 。 


另外 , 系统 评价 可 减少 有 关 偏 倚 的 影响 ,从 而 提高 研究 结果 的 真实 性 和 准确 性 。 


三 、 系 统 评价 与 叙述 性 文献 综述 的 区 别 与 联系 

系统 评价 和 令 述 性 文献 综述 均 是 对 临床 研究 文献 的 分 析 和 总 结 , 目前 多 为 回顾 性 、 观 察 性 
的 研究 , 也 可 为 前 瞻 性 系统 评价 。 回 顾 性 的 系统 评价 因 受到 纳入 的 原始 临床 研究 质量 的 制约 ， 
难以 有 效 控制 偏 信和 混杂 的 影响 。 因 此 ,确定 一 简 “综述 " 属于 叙述 性 文献 综述 还 是 系统 评价 ? 
其 质量 、 价 值 如 何 ? 主要 取决 于 是 否 采用 科学 的 方法 减少 了 偏 倚 、 混 杂 因素 的 影响 。 

叙述 性 文献 综述 常常 涉及 某 一 问题 的 多 个 方面 ,如 糖尿 病 的 病理 、 病 理 生理 、 流 行 病 学 、 诊 
断 方法 及 预防 治疗、 康复 的 措施 , 也 可 仅 涉及 某 一 方面 的 问题 , 如 诊断 、 治 疗 等 。 而 系统 评 
价 或 meta 分 析 的 研究 问题 往往 比较 具体 明确 。 因 此 , 叙述 性 文献 综述 有 助 于 广泛 了 解 菜 一 疾 


病 的 全 貌 ， 而 系统 评价 则 有 助 于 深入 了 解 某 一 具体 疾病 的 某 一 具体 方面 。 二 者 的 主要 区 别 见 
表 7-1。 





表 7-1 叙述 性 文献 综述 与 系统 评价 的 区 别 





特征 叙述 性 文献 综述 系统 评价 
研究 的 问题 涉及 的 范畴 常 较 广泛 常 集中 于 某 一 临床 问题 
原始 文献 来 源 常 未 说 明 、 不 全 面 明确 , 常 为 多 渠道 
检索 方法 常 未 说 明 有 明确 的 检索 策略 
原始 文献 的 选择 常 未 说 明 、 有 潜在 偏 估 有 明确 的 选择 标准 
原始 文献 的 评价 评价 方法 不 统一 有 严格 的 评价 方法 
结果 的 合成 多 采用 定性 方法 定性 、 定 量 分 析 均 可 , 以 定量 方法 居多 
结论 的 推断 有 时 会 遵循 研究 依据 大 多 遵循 研究 依据 
结果 的 更 新 未 定期 更 新 定期 加 以 更 新 


二 节 ”系统 评价 的 方法 


系统 评价 是 一 把 双 刃 剑 , 一 方面 能 够 通过 对 多 个 有 争议 或 甚至 相互 矛盾 的 小 型 临床 研究 采 
用 严格 、 系 统 的 方法 进行 评价 ,分析 和 合成 , 以 解决 争议 或 提出 建议 , 指导 临床 实践 、 医 疗 决策 
以 及 明确 今后 的 研究 方向 ; 另 一 方面 , 如 果 纳 入 的 原始 研究 质量 不 高 或 进行 系统 评价 /meta 分 析 
的 方法 不 当 , 会 产生 不 正确 的 信息 , 造成 误导 。 因 此 ,系统 评价 方法 和 步骤 , 决定 了 其 结果 和 结 
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论 的 真实 可 靠 性 。 

系统 评价 本 身 只 不 过 是 一 种 研究 方法 ， 并 不 仅 限 于 对 随机 对 照 试 验 或 仅 对 治疗 性 研究 进 
行 系统 评价 。 根 据 研 究 领域 划分 ， 系统 评价 可 应 用 于 基础 研究 、 临 床 研究 、 医 学 教育 、 方 法 学 研 
究 、 政 策 研究 等 领域 ; 根据 研究 问题 不 同 ， 系统 评价 又 可 应 用 于 病因 、 诊 断 、 治 疗 、 预 后 、 卫 生 经 
济 评价 和 定性 研究 (qualitative research ) 等 方面 ; 若 根据 纳入 的 原始 研究 类 型 不 同 (study design )， 
还 可 分 为 基于 临床 试验 (controlled trial ) 和 基于 观察 性 研究 (observational studies ) 的 系统 评价 ,前 
者 如 随机 对 照 试验 和 非 随机 对 照 试验 的 系统 评价 ， 后 者 如 队列 研究 和 病例 对 照 研究 的 系统 评 
价 ; 若 按照 纳入 原始 研究 的 方向 性 , 又 分 为 前 上 脆性、 回顾 性 和 累积 性 系统 评价 ; 根据 资料 分 析 时 
是 否 采用 统计 学 方法 (meta 分 析 ), 可 分 为 定性 和 定量 的 系统 评价 。 目 前 , 鉴于 随机 对 照 试 验 的 
系统 评价 在 理论 和 方法 学 上 较 完 善 且 论证 强度 较 高 , 数量 较 多 ， 已 成 为 实践 循 证 医学 的 重要 证 
据 来 源 。 

尽管 系统 评价 的 种 类 繁多 , 但 基本 方法 和 步骤 相似 (图 7-1)， 仅 在 检索 策略 、 文 献 质量 评 
价 、 数 据 提取 以 及 汇总 分 析 等 方面 略 有 不 同 , 本 节 将 以 Cochrane 系统 评价 为 例 ， 简 述 其 基本 方 
法 和 步骤 。 
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7. 解释 结果 ,撰写 报 告 





8. 更 新 系统 评价 


图 7-1 系统 评价 程序 图 示 


一 、 确 立 题目 .制定 系统 评价 计划 书 


系统 评价 可 为 医疗 保健 措施 的 管理 和 应 用 提供 重要 的 决策 依据 , 特别 适用 于 那些 干预 措施 
的 利弊 不 明 、 靠 单个 临床 研究 结果 难以 确定 或 在 临床 应 用 过 程 中 存在 较 大 争议 时 使 用 。 因 此 ， 
系统 评价 的 题目 主要 来 源 于 临床 医疗 实践 中 那些 不 肯定 有 争论 的 临床 诊治 问题 。 例 如 : 在 高 
危 人 群 中 服用 小 剂量 的 阿司匹林 能 否 预防 心 脑 血管 病 的 发 生 ? 抗 凝 剂 治疗 能 否 预防 缺 血 性 心 
脏 病 伴 心房 纤 颤 患者 继 发 心脏 事件 ? 急性 胆囊 炎 患 者 , 早期 (发 病 后 7 天 内 ) 与 延缓 (入 院 治疗 
后 6 周 ) 行 腹腔 镜 胆 囊 切 除 术 的 疗效 和 安全 性 有 无 差别 等 ? 

为 避免 重复 , 首先 应 进行 全 面 、 系 统 的 检索 , 了解 针对 同一 临床 问题 的 系统 评价 或 meta 分 
析 是 知已 经 存在 或 正在 进行 。 如 果 有 ,其 质量 如 何 ?是否 已 经 过 时 ? 如果 现 有 的 系统 评价 或 
meta 分 析 已 过 时 或 质量 差 , 则 可 考虑 进行 更 新 或 重新 制作 一 个 新 的 系统 评价 。 
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系统 评价 解决 的 问题 很 专 一 , 涉及 的 研究 对 象 、 设 计 方案 以 及 治疗 措施 需 相 似 或 相同 。 因 
此 ,在 确立 题目 时 , 应 围绕 研究 问题 明确 四 个 要 素 : 研究 对 象 的 类 型 : 所 患 疾病 类 型 及 其 诊断 
标准 、 研 究 人 群 的 特征 和 场所 ; @ 研 究 的 干预 措施 和 进行 比较 的 措施 ; @ 主 要 研究 结果 的 类 型 ， 
包括 所 有 重要 的 结果 ( 主要 结果 和 次 要 结果 ) 及 严重 的 不 良 反应 ; @ 研 究 的 设计 方案 。 这 些 要 素 
对 指导 查寻 、 第 选 和 评价 各 个 临床 研究 , 收集 、 分 析 数 据 及 解释 结果 的 应 用 价值 等 均 十 分 重要 ， 
必须 准确 、 清 楚 定义 。 

一 旦 确立 了 系统 评价 的 题目 , 应 着 手 制定 计划 书 (protocol), 内 容 包括 系统 评价 的 题目 、 背 
最 资料 、 目的、 检索 文献 的 方法 及 策略 .选择 合格 文献 的 标准 、 评 价 文献 质量 的 方法 、 收 集 和 分 
析 数 据 的 方案 等 。 

原则 上 , 系统 评价 研究 的 问题 必须 在 制定 计划 书 和 收集 文献 前 就 已 确定 , 这 样 可 避免 作者 
根据 原始 文献 的 数据 信息 和 结果 擅自 更 改 系统 评价 的 题目 及 内 容 , 导致 结论 出 现 偏差 。 然 而 ， 
由 于 多 数 系统 评价 是 对 现 有 文献 资料 的 分 析 和 总 结 , 受 原 始 文献 及 其 质量 的 制约 , 如 果 事先 不 
了 解 与 题目 相关 的 资料 信息 和 内 容 , 则 难以 确定 一 个 好 题目 。 因 此 , 在 进行 系统 评价 的 过 程 中 
如 果 要 改变 题目 或 评价 的 内 容 , 必须 明确 回答 原因 及 动机 , 并 相应 修改 查寻 文献 和 收集 文献 的 
方法 。 














二 .检索 文献 


系统 、 全 面 地 收集 所 有 相关 的 文献 资料 是 系统 评价 与 叙述 性 文献 综述 的 重要 区 别 之 一 。 为 
了 避免 发 表 偏 倚 (publication bias) 和 语言 偏 倚 (language bias), 应 围绕 要 解决 的 问题 , 按照 计划 书 
中 制定 的 检索 策略 ( 包括 检索 工具 及 每 一 检索 工具 的 检索 方法 ), 采用 多 种 渠道 和 系统 的 检索 方 
法 。 除 发 表 的 论著 之 外 ， 还 应 收集 其 他 尚未 发 表 的 内 部 资料 以 及 多 语种 的 相关 资料 。 

除 利用 文献 检索 的 期 刊 工 具 及 电子 光盘 检索 工具 (如 MEDLINE、 Embase、SCIlSearch、 Registers 
of clinical trials ) 外 , 制作 系统 评价 时 , 还 强调 通过 与 同事 专家 和 药 厂 联系 以 获得 未 发 表 的 文献 
资料 如 学 术 报告 、 会 议论 文集 或 毕业 论文 等 ; 对 已 发 表 的 文章 , 由 Cochrane 协作 网 的 工作 人 员 
采用 计算 机 检索 和 手工 检索 联合 的 方法 查寻 所 有 的 随机 对 照 试验 , 先后 建立 了 Cochrane 对 照 斌 
验 中 心 注册 库 (Cochrane Central Register of Controlled Trials, CENTRAL ) 和 各 专业 评价 小 组 对 照 
试验 注册 库 , 既 可 弥补 检索 工具 如 MEDLINE 等 标识 RCT 不 全 、 漏 录 的 问题 , 也 有 助 于 系统 评价 
者 快速 、 全 面 获得 相关 的 原始 文献 资料 。 


三 .选择 文献 

选择 文献 是 指 根据 事先 拟定 的 纳入 和 排除 标准 , 从 收集 到 的 所 有 文献 中 检 出 能 够 回答 研究 
问题 的 文献 资料 。 因 此 , 选择 标准 应 根据 确立 的 研究 问题 及 构成 研究 问题 的 四 要 素 即 研究 对 
象 . 干 预 措施 、 主要 研究 结果 和 研究 的 设计 方案 而 制定 。 例 如 : 拟 探索 静脉 滴 注 硫酸 镁 能 否 降 
低 急性 心肌 梗死 患者 的 近期 死亡 率 ?围绕 这 一 临床 问题 , 如果 确 定 研究 对 象 为 急性 心肌 梗死 
患者 , 不 考虑 梗死 的 部 位 、 患 者 性 别 、 年 龄 ,干预 措施 为 静脉 使 用 硫酸 镁 与 安奈 剂 比较 , 主要 研 
究 结果 为 35 天 内 的 病死 率 , 设计 方案 为 随机 对 照 试验 CRCT), 则 所 选 临床 研究 必须 符合 上 述 条 
件 。 而 像 口服 硫酸 镁 或 静脉 滴 注 硫酸 镁 与 其 他 药物 进行 比较 .结果 为 心肌 梗死 35 天 以 后 的 病 
死 率 或 者 非 RCT 的 文献 资料 则 不 能 纳入 。 

文献 资料 的 选择 应 分 三 步 进行 (图 7-2): D 初 得 : 根据 检索 出 的 引文 信息 如 题目 、 摘 要 筛 除 
明显 不 合格 的 文献 , 对 肯定 或 不 能 肯定 的 文献 应 查 出 全 文 再 进行 筛选 ; 四 阅读 全 文 : 对 可 能 合 
格 的 文献 资料 , 应 逐一 阅读 和 分 析 全 文 后 , 再 确认 是 否 合格 ; @ 与 作者 联系 : 一 旦 被 排除 的 文献 
将 不 再 纳入 , 因此 , 如 果 文 中 提供 的 信息 不 全 而 不 能 确定 者 , 或 者 有 疑问 和 有 分 歧 的 文献 应 先 
纳入 , 通过 与 作者 联系 获得 有 关 信息 后 再 决定 取 合 。 
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图 7-2 ”选择 文献 的 基本 步骤 


、 评 价 偏 倚 风 险 


原始 研究 的 自身 设计 和 实施 质量 如 何 , 将 影响 研究 结果 的 真实 性 。 需 对 纳入 研究 的 偏 倚 
风险 (risk of bias ) 进 行 评价 , 即 评 估 单 个 临床 试验 在 设计 、 实 施 和 分 析 过 程 中 防止 或 减少 系统 
误差 (或 偏 倚 ) 和 随机 误差 的 程度 。 评 价 结果 可 作为 原始 研究 文献 的 纳入 立 值 、 用 于 解释 不 同 
文献 结果 差异 的 原因 或 用 来 计算 敏感 性 分 析 和 定量 分 析 (meta 分 析 ) 时 的 权重 值 。 研究 质量 评 
价 应 包括 两 方面 内 容 : @ 内 在 真实 性 (internal validity ): 指 单个 研究 结果 接近 真 值 的 程度 , 即 受 
各 种 偏 倚 因 素 如 选择 偏 倚 、 实 施 偏 倚 、 失 访 偏 倚 和 测量 偏 倚 的 影响 大 小 ; @ 外 部 真实 性 (external 
validity, generalizability ): 指 研究 结果 是 否 可 以 推广 应 用 于 研究 对 象 以 外 的 其 他 人 群 ， 应 结合 结 
果 的 实用 价值 与 推广 应 用 的 条 件 进行 综合 评定 , 外 部 真实 性 主要 与 研究 对 象 的 特征 、 研究 措施 
的 实施 方法 和 条 件 以 及 结果 的 选择 标准 等 密切 相关 。 

研究 质量 评价 (assessment of quality ) 是 评估 单个 研究 在 设计 、 实 施 和 分 析 过 程 中 ， 防止 或 减 
少 偏 倚 或 系统 误差 的 情况 ,也 称 为 “方法 学 质量 评价 (assessment of methodological quality) 。 一 
直 以 来 , 研究 质量 评价 和 偏 倚 风 险 评价 被 认为 是 等 同 的 ,但 Cochrane 系统 评价 手册 认为 偏 倚 和 
质量 有 区 别 。 例 如 , 某 研 究 不 可 能 对 研究 对 象 、 干 预 措施 的 实施 者 或 结果 评价 者 采用 盲 法 ， 若 
由 此 认定 该 研究 的 “ 低 质量 ", 并 不 恰当 。 又 如 研究 质量 已 达到 了 可 能 的 最 高 水 平 ， 但 并 不 是 说 
该 研究 没有 偏 倚 。 另 外 , 某 些 与 研究 质量 相关 的 指标 并 不 直接 导致 偏 倚 风 险 , 如 样本 量 估算 、 
伦理 审查 和 报告 质量 等 。 

偏 倚 是 指导 致 研究 结果 偏离 真 值 的 现象 , 存在 于 临床 试验 中 的 不 同 阶段 , 如 从 选择 和 分 配 
研究 对 象 、 实 施 干 预 措施 、 随 访 研究 对 象 、 测 量 和 报告 研究 结果 的 每 个 阶段 均 可 出 现 ( 图 7-3 )。 
因而 , 偏 倚 可 分 为 以 下 五 种 : 选择 偏 倚 (selection bias): 发 生 在 选择 和 分 配 研究 对 象 时 , 因 随机 
方法 不 完善 造成 组 间 基 线 不 可 比 , 可 夸大 或 缩小 干预 措施 的 疗效 。 采用 真正 的 随机 方法 并 对 随 
机 分 配方 案 进行 完善 的 隐藏 , 可 避免 此 类 偏 倚 的 发 生 。@ 实 施 偏 倚 (performance bias); 发 生 在 干 
预 实施 的 过 程 中 , 除 待 比较 的 措施 不 同 外 , 所 提供 的 其 他 措施 也 不 一 样 。 采用 标 化 治疗 方案 和 
育 法 干预 可 避免 实施 偏 倚 。@ 随 访 偏 倚 (attrition bias ): 指 在 试验 随访 过 程 中 , 试验 组 或 对 照 组 
因 退 出 、 失 访 、 违 背 治疗 方案 等 造成 人 数 或 其 他 情况 不 一 致 而 产生 的 系统 偏差 。 对 此 ， 应 尽量 搜 
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集 失 访 者 的 信息 以 及 对 失 访 人 员 采 用 恰当 的 统计 学 方法 处 理 , 如 意向 治疗 分 析 (intention to treat 
analysis, IIT) 等 , 可 减少 其 影响 。@ 测 量 偏 倚 (measurement bias/detection bias/ascertainment bias ): 
试验 组 和 对 照 组 的 结果 测量 方法 不 一 致 所 造成 的 系统 偏差 , 特别 容易 在 主观 判断 研究 结果 时 出 
现 。 采 用 统一 、 标 化 测量 方法 以 及 对 研究 对 象 和 结果 测量 者 实施 言 法 ,可 避免 其 影响 。@ 报 告 
偏 倚 (reporting bias ): 指 文章 中 报告 的 结果 与 实际 分 析 结果 间 存 在 的 系统 偏差 , 如 有 选择 性 地 报 


告 结果 。 
选择 性 偏 倚 研究 对 象 选择 与 分 配 


sl 





实施 偏 倚 
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图 7-3” 偏 倚 来 源 





目前 , 尽管 评价 文献 质量 的 方法 和 工具 较 多 ,但 缺乏 “ 金 标准 "。 评 价 工具 可 分 清单 或 一 栏 
表 式 (checklist, 即 有 许多 条 目 , 但 只 打 钩 、 不 评分 ) 和 量 表 评 分 (scale, 即 有 许多 条 目 , 每 个 条 目 
均 给 予 评分 , 进而 给 予 相同 或 不 同 权重 进行 加 权 评 分 )。 迄 今 至 少 有 9 种 以 上 清单 (checklist) 和 
60 余 种 量 表 (scale ) 用 于 评价 随机 对 照 试验 的 方法 学 质量 ,条 目 数 从 3 个 到 57 个 不 等 , 一 般 需 要 
花 10~45 分 钟 完成 评价 。 由 于 这 些 评价 方法 易 受 文献 报告 质量 和 文献 评估 者 的 主观 因素 影响 ， 
Cochrane 手册 5.0 未 推荐 使 用 任何 一 种 清单 或 量 表 , 要 求 采 用 由 Cochrane 协作 网 的 方法 学 家 、 
编辑 和 系统 评价 员 共 同 制定 的 新 的 “ 偏 倚 风 险 评估 "工具 ( 表 7-2), 包括 7 个 方面 : 随机 分 配 
方法 ; 四 分配 方案 隐藏 @@ 对 研究 对 象 、 治 疗 方案 实施 者 采用 育 法 ; @ 对 研究 结果 测量 者 采用 
盲 法 ; @ 结 果 数据 的 完整 性 ; @ 选 择 性 报告 研究 结果 ; @ 其 他 偏 倚 来 源 。 利 用 上 述 7 条 标准 可 
逐一 比 对 每 一 个 纳入 研究 ,并 作出 “ 偏 人 风险 低 "“ 偏 倚 风 险 高 "和 “ 偏 倚 风 险 不 确定 " 的 判断 。 
其 中 ,四 四、@ .@ 条 用 于 评估 每 一 篇 纳入 研究 的 偏 倚 风 险 , 其 余 3 条 则 需 针对 每 一 篇 纳入 
研究 中 的 不 同 研究 结果 进行 评估 ,强调 同一 研究 中 不 同 结果 受 偏 倚 影 响 程度 不 同 。 偏 倚 风 险 
评价 结果 不 仅 采 用 文字 和 表格 描述 , 还 要 求 采用 图 示 , 更 形象 、 直 观 反 映 偏 倚 情 况 。 此 评估 工 
具 对 每 一 条 的 判断 均 有 明确 标准 , 减少 了 评估 者 主观 因素 影响 , 保证 了 评估 结果 具有 更 好 的 
可 靠 性 。 


表 7-2 ”Cochrane 协作 网 的 偏 倚 风 险 评价 工具 








评价 条 目 评价 内 容 描述 作者 判断 
QO 随机 分 配方 法 详细 描述 产生 随机 分 配 序列 的 方法 , 以 助 于 评估 能 ”随机 分 配 序列 的 产生 是 
否 产 生 组 间 可 比 性 否 正确 
@ 分 配方 案 隐 茂 详细 描述 隐藏 随机 分 配 序列 的 方法 , 以 助 于 判断 干 “ 分 配方 案 隐 藏 是 否 完善 


预 措施 分 配 情况 是 否 可 预知 
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评价 条 目 评价 内 容 描述 作者 判断 





图 对 研究 对 象 .治疗 方案 描述 对 研究 对 象 和 试验 措施 实施 者 实施 盲 法 的 方 ” 盲 法 是 否 完善 
实施 法 ,以 防止 他 们 知道 受 试 者 接受 的 干预 措施 。 提 供 
每 一 研究 结果 评 判断 盲 法 是 否 成 功 的 相关 信息 
国 对 研究 结果 测量 者 采用 ”描述 对 结果 测量 者 实施 言 法 的 方法 , 以 防止 他 们 知 讶 法 是 否 完善 
育 法 (针对 每 -一 研究 结 ” 道 受 试 者 接受 的 干预 措施 。 提 供 判断 盲 法 是 否 成 
果 评 估 ) 功 的 相关 信息 
@@ 结 果 数 据 的 完整 性 ( 针 报告 每 个 主要 结局 指标 的 数据 完整 性 , 包括 失 访 和 结果 数据 是 否 完 整 
对 每 一 研究 结果 评估 ) ”退出 的 数据 。 明 确 是 否 报告 失 访 /退出 、 每 组 人 数 
(与 随机 入 组 的 总 人 数 相 比 )、 失 访 / 退 出 原因 ,是 
否 采用 11 分析 
@ 选 择 性 报告 研究 结果 “描述 选择 性 报告 结果 的 可 能 性 (由 系统 评价 作者 判 ” 研 究 报告 是 否 提 示 无 选 














断 ) 及 情况 择 性 报告 结果 

@ 其 他 信人 来 源 除 以 上 5 个 方面 ,是 否 存 在 其 他 引起 偏 倚 的 因素 ? 研究 是 否 存 在 引起 高 度 
若 事先 在 计划 韦 中 提 到 某 个 问题 或 因素 , 应 在 全 文 偏 倚 风 险 的 其 他 因素 
中 作答 








为 避免 选择 文献 和 评价 文献 质量 人 员 的 偏 倚 , 可 考虑 一 篇 文章 由 多 人 或 育 法 选 评 , 也 可 采 
用 专业 与 非 专业 人 员 相 互 配合 、 共 同 选 评 的 办 法 , 对 选 评 文献 过 程 中 存在 的 分 歧 可 通过 共同 讨 
论 或 请 第 三 方 协 助 解决 。 若 多 人 选择 文献 时 , 应 计算 不 同 评价 者 间 的 一 致 性 (Kappa 值 ) 此外， 
最 好 先进 行 预 试验 , 以 摸索 经 验 , 标 化 和 统一 选择 、 评 价 方法 。 


五 .收集 数据 


根据 制定 的 调查 表 和 需要 收集 的 内 容 , 收录 有 关 数据 资料 , 其 中 包括 : 了 一般 资料 : 如 评价 
的 题目 、 评 价 者 的 姓名 、 原 始 文献 编号 和 来 源 、 评 价 的 日 期 等 ; 四 研究 特征 : 如 研究 的 合格 性 、 研 
究 对 象 的 特征 和 研究 地 点 、 文 献 的 设计 方案 和 质量 、 研 究 措施 的 具体 内 容 和 实施 方法 有关 偶 
倚 防 止 措施 、 主要 的 试验 结果 等 ; @@ 结 果 测 量 : 如 随访 时 间 . 失 访 和 退出 情况 .分 类 资料 应 收集 
每 组 总 人 数 及 事件 发 生 率 、 连 续 资 料 应 收集 每 组 研究 人 数 、 均 数 和 标准 差 或 标准 误 等 。 

所 有 的 数据 资料 均 要 输入 系统 评价 管理 软件 ( Review Manager, RevMan 以 进行 文献 结 果 
的 分 析 和 报告 。 

















六 、 分 析 资 料 和 报告 结果 

对 收集 的 资料 , 可 采用 定性 或 定量 的 方法 进行 分 析 , 以 获得 相应 的 结果 。 

(一 ) 定性 分 析 (non-quantitative synthesis) 

定性 分 析 是 采用 描述 的 方法 , 将 每 个 临床 研究 的 特征 按 研究 对 象 .干预 措施 .研究 结果 、 偶 
倚 风 险 和 设计 方法 等 进行 总 结 并 询 成 表格 形式 , 以 便 纵览 所 有 纳入 研究 的 结果 方法 及 癸 完 问 





的 差异 ,同时 后 助 制订 定量 合 成 计划 及 其 结果 解释 , 因此 ,定性 分 析 是 定 旦 分 析 前 必 不 可 少 的 
步 桑 。 

(二 ) 定量 分 析 (quantitative synthesis) 

定量 分 析 包 括 同 质 性 检验 (或 异 质 性 检验 )、 meta 分 析 和 敏感 性 分 析 。 
评价 或 meta 分 析 是 将 多 个 研究 结果 合并 成 一 个 
: 异 质 性 (elinical 
祥 质 性 (meih- 








1. 异 质 性 检验 (heterogeneity) 定量 
效应 值 , 但 不 同 研究 结果 间 不 可 避免 存在 差 
heterogeneity ), 指 不 同人 研究 中 研究 对 象 、 干 预 措施 和 结果 
odological heierogeneity ), 指 试 验 设计 和 质量 在 不 同 研究 中 存在 的 差异 ; 统计 学 异 
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heterogeneity ), 指 不 同 研究 中 干预 措施 的 效应 值 存在 的 差异 , 是 临床 异 质 性 和 方法 学 异 质 性 共 
同 作用 的 结果 。 异 质 性 检验 是 指 对 不 同 原始 研究 结果 之 间 的 变异 程度 进行 检验 。 如 果 检 验 结 
果 有 统计 学 意义 , 应 解释 其 可 能 的 原因 并 考虑 是 否 进行 结果 合成 。 确 定 各 研究 结果 是 否 同 质 有 
两 种 方法 : 一 种 是 目测 法 , 即 通过 绘制 森林 图 观察 各 研究 效应 值 的 可 信 区 间 是 否 有 重合 及 其 程 
度 ,如果 可 信和 区间 差异 太 大 , 则 放弃 合成 分 析 或 采用 随机 效应 模型 。 另 一 种 方法 是 直接 进行 同 
质 性 检验 (CO test, Chi-square test )， 在 此 基础 上 借助 7 定量 估计 异 质 性 大 小 , 如 0%~40% 表示 蜡 
质 性 可 能 不 重要 , 30%~60% 表示 有 中 度 异 质 性 , 50%~90% 表示 有 显著 异 质 性 ,75%~100% 表示 
有 很 大 异 质 性 。 

2. meta 分 析 ”根据 资料 类 型 及 评价 目的 选择 效应 量 并 对 其 进行 定量 合成 分 析 。 例 如 对 分 
类 变量 , 可 选择 优势 比 (odds ratio , OR)、 相 对 危险 度 (relative risk, RR)、 危 险 度 差 值 (risk difference) 
和 防止 一 例 事件 发 生 需 要 治疗 同类 患者 的 人 数 ( number needed to treat, NNT ) 等 作为 效应 量 表 
达 。 对 连续 性 变量 ， 当 结 果 测 量 采用 相同 度量 衡 单位 时 应 选择 均 数 差 值 (mean difference, MD)， 
而 当 结 果 测 量 采用 不 同 度量 衡 单位 , 如 在 不 同 研究 中 采用 不 同 量 表 测试 疼痛 评分 时 , 则 应 选择 
标 化 的 均 数 差 值 ( standardized mean difference, SMD )。 用 meta 分 析 合 成 结果 时 , 可 选择 固定 效 
应 模型 (fixed effect model ) 或 随机 效应 模型 (random effect model), 结果 采用 森林 图 (forest plot) 
表示 。 

3. 敏感 性 分 析 ( sensitivity analysis) 指 改 变 某 些 影响 结果 的 重要 因素 如 纳入 标准 、 偏 倚 风 
险 、 失 访 情况 、 统 计 方 法 ( 固定 效应 或 随机 效应 模型 ) 和 选择 不 同 的 效应 量 ( 优 势 比 或 相对 危险 
度 ) 等 , 以 观察 同 质 性 和 合成 结果 是 否 发 生变 化 , 从 而 判断 合并 结果 的 稳定 性 及 其 程度 。 


七 、 解 释 系统 评价 的 结果 和 做 结论 


系统 评价 的 目的 是 帮助 患者 、 公 众 、 医 生 、 管 理 者 和 决策 者 进行 卫生 决策 , 旨 在 提供 信息 和 
辅助 解释 结果 , 而 不 是 作出 推荐 意见 。 因 此 , 清晰 陈述 研究 结果 、 深 入 的 讨论 和 明确 的 结论 是 
系统 评价 的 重要 组 成 部 分 。 解 释 系统 评价 和 做 结论 必须 基于 研究 的 结果 , 内 容 应 包括 ; 

(一 ) 系统 评价 证 据 的 质量 

Cochrane 协作 网 采用 GRADE( Grading of Recommendations Assessment, Development and 
Evaluation ) 分 级 和 证 据 质量 评价 系统 对 系统 评价 的 总 体质 量 进行 评估 。 该 系统 是 2004 年 由 包 
括 WHO 在 内 的 19 个 国家 和 国际 组 织 、67 名 专家 (包括 临床 指南 专家 、 循 证 医学 专家 、 各 个 标准 
的 主要 制定 者 及 证 据 研究 人 员 ) 共 同 成 立 的 GRADE 工作 组 循 证 制定 出 的 、 国 际 统一 的 证 据 质 
生 分 级 和 推荐 强度 标准 , 分 别 于 2008 年 正式 在 BMJ 发 表 5 篇 系列 文章 , 2011 年 再 次 完善 、 更 新 
并 在 临床 流行 病 学 杂志 系列 发 表 20 篇 文章 , 为 生产 者 和 GRADE 结果 使 用 者 提供 了 详尽 指导 。 
GRADE 质量 评价 系统 将 系统 评价 证 据 的 质量 分 为 高 .中 、 低 、 极 低 4 个 等 级 , 并 根据 纳入 研究 
的 总 体 偏 倚 风 险 、 研 究 结果 的 一 致 性 、 证 据 的 直接 性 、 结 果 的 精度 以 及 是 否 存在 发 表 偏 倚 等 5 个 
因素 调整 随机 对 照 试验 的 质量 级 别 ; 同时 也 可 根据 效应 值 大 小 、 是 否 存 在 剂量 - 效应 关系 以 及 
是 否 存在 偏 倚 导 致 效应 低估 甚至 无 效 的 可 能 性 等 ,适当 提升 观察 性 研究 的 质量 级 别 。 

(二 ) 推广 应 用 性 

在 确定 系统 评价 结果 的 应 用 价值 时 , 首先 应 考虑 干预 措施 对 患者 的 利 贞 关 系 , 其 次 应 考虑 
系统 评价 中 的 纳入 研究 , 其 研究 对 象 是 否 与 你 的 患者 情况 相似 ? 是 否 存在 生物 学 、 社 会 文化 彰 
景 .依从 性 .基础 危险 度 、 病 情 、 价 值 观 等 方面 的 差异 。 

(三 ) 解释 统计 分 析 结 果 

解释 meta 分 析 结果 时 , 应 同时 考虑 干预 措施 的 利和 星 , 合并 效应 量 及 其 95% 可 信和 区间 。 点 
估计 值 主要 表示 合并 效应 量 的 强度 和 方向 ， 而 可 信 区 间 则 反映 合并 效应 量 的 变动 范围 和 精确 
性 ,二 者 结合 可 提供 更 全 面 的 信息 ,有 助 于 解释 结果 的 临床 价值 。 
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(四 ) 结论 

系统 评价 的 结论 应 包括 对 临床 实践 的 意义 和 未 来 研究 的 价值 两 部 分 内 容 。 在 确定 这 两 方 
面 意义 时 , 要 考虑 证 据 的 质量 干预 措施 的 利弊 、 患 者 的 价值 取向 及 卫生 资源 的 利用 , 目的 在 于 
帮助 医务 工作 者 和 决策 者 进行 正确 的 选择 和 应 用 , 为 进一步 的 研究 指明 方向 。 


八 、 更 新 系统 评价 


系统 评价 的 更 新 是 指 在 系统 评价 发 表 以 后 , 定期 收集 新 的 原始 研究 , 按 前 述 步骤 重新 进行 
分 析 、 评 价 , 以 及 时 更 新 和 补充 新 的 信息 , 使 系统 评价 日 至 完善 。 
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一 、meta 分 析 的 概述 


meta 分 析 是 一 种 定量 合并 方法 。 定 量 合 并 分 析 的 想法 最 早 是 由 统计 学 家 Karl Pearson 在 
1904 年 提出 , 但 直到 1955 年 才 得 以 在 临床 研究 中 具体 应 用 。G. V. Glass 于 1976 年 在 教育 研 
究 中 正式 将 这 类 对 文献 进行 综合 研究 的 方法 冠 以 “meta-analysis”。 其 中 “meta” 为 希腊 词 , 有 
“after” 、“more comprehensive" “secondary" 之 意 。 中 文 译名 较 多 , 有 meta 分 析 、 蔡 茜 分 析 、 综合 
分 析 、 元 分 析 、 二 次 分 析 等 。 其 中 以 “meta 分 析 " 最 为 常用 。meta 分 析 通 过 对 多 个 同类 独立 研究 
结果 的 汇总 和 合并 分 析 , 可 以 达到 增 大 样本 含量 、 提 高 检验 效能 的 目的 ; 同时 也 可 提高 效应 量 
的 估计 精度 ; 特别 是 当 多 个 研究 结果 不 一 致 或 都 无 统计 学 意义 时 , 用 meta 分 析 可 得 到 更 加 接近 
真实 情况 的 统计 结果 。 

系统 评价 (或 系统 综述 ) 中 的 汇总 分 析 分 为 定性 与 定量 分 析 两 种 。 如 果 纳 入 的 原始 研究 缺 
三 有 效 数据 或 者 研究 结果 间 差 别 过 大 ,那么 就 无 法 进行 定量 评价 , 只 能 得 到 定性 描述 结果 ; 相 
反 ,车 条 件 允 许 , 可 考虑 进行 定量 评价 , 即 meta 分 析 。meta 分 析 是 将 两 个 或 多 个 相似 研究 结果 
进行 定量 综合 分 析 的 一 类 方法 。 广 义 上 包括 提出 问题 、 检 索 相 关 研 究 文献 .制定 文献 纳 人 和 排 
除 标准 .描述 基本 信息 、 定 量 综合 分 析 等 一 系列 过 程 。 狭 义 上 , meta 分 析 则 专 指 系统 评价 中 的 
定量 分 析 。 

因此 , 在 一 个 系统 评价 中 可 以 选用 某 个 结局 指标 进行 _ 次 meta 分 析 , 也 可 选用 多 个 结局 指 
标 实施 多 个 meta 分 析 。 事 实 上 , 由 于 纳入 研究 的 质量 、 设 计 类 型 .资料 类 型 以 及 方法 学 等 限制 ， 
只 有 部 分 系统 评价 可 以 实现 定量 分 析 。 

目前 , 有 关系 统 评价 及 meta 分 析 已 经 在 临床 研究 和 临床 实践 中 得 以 普及 与 推广 , 特别 是 已 
被 广泛 应 用 于 效应 量 较 小 或 存在 争议 的 治疗 性 研究 (主要 为 RCT)、 预 后 研究 、 病因 学 研究 等 ， 
并 逐步 推广 到 诊断 试验 的 系统 评价 之 中 。 


二 、meta 分 析 的 基本 过 程 


meta 分 析 过 程 包括 数据 提取 及 汇总 、 异 质 性 检验 、 模 型 选择 、 合 并 效应 量 估计 及 假设 检验 等 。 

(一 ) 数据 提取 

数据 是 否 准确 可 靠 , 尤为 关键 , 它 是 meta 分 析 的 基础 , 否则 即使 再 先进 的 统计 学 方法 , 也 不 
能 弥补 数据 本 身 的 缺陷 。 所 以 在 收集 与 提取 数据 时 , 应 广 开 渠 道 , 通过 多 途径 收集 ， 确保 数据 
全 面 完整 ; 同时 ,采取 有 效 的 质 控 措施 , 如 多 人 同步 提取 数据 , 防止 选择 性 偏 倚 ; 最 后 对 数据 次 
料 自身 的 真实 性 也 要 进行 严格 评价 , 在 此 基础 上 , 方 可 实施 meta 分 析 。 

(二 ) 数据 类 型 及 其 效应 量 的 表达 

目前 可 用 于 meta 分 析 的 数据 类 型 主要 包括 以 下 5 类 : 二 分 类 变量 资料 , 按照 某 种 属性 
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分 为 互 不 相 容 的 两 类 , 如 描述 临床 结局 时 ,选用 存活 、 死 亡 , 复发 或 不 复发 等 ; @ 数 值 变量 / 连 
续 人性 变量 资料 , 如 血压 值 、 血糖.CD4/CD8 等 ,往往 有 度量 衡 单位 , 且 能 够 做 到 精确 测量 ; @ 等 
级 资料 /有 序 多 分 类 变量 资料 , 即将 某 种 属性 分 为 多 个 类 别 , 类 与 类 间 有 程度 或 等 级 上 差异 。 
如 疗效 判定 用 痊愈 、 显 效 、 有效、 无 效 等 表示 。 以 上 三 类 数据 类 型 比较 常见 , 此 外 还 有 计数 
数据 或 密度 资料 , 即 同一 个 体 在 一 定 观 察 时 间 内 可 发 生 多 次 不 良 事 件 , 如 心肌 梗死 骨折 、 
入院 次 数 等 ; 以 及 生存 资料 , 同时 观察 两 类 数据 , 即 是 否 发 生 不 良 事件 以 及 发 生 不 良 事件 的 时 
间 等 。 

不 同 数据 类 型 决定 了 效应 量 的 表达 方式 有 所 不 同 。 效 应 量 (effect size ) 常 被 定义 为 临床 上 
有 意义 的 值 或 改变 量 。 当 结局 观察 指标 为 二 分 类 变量 资料 时 ,常用 的 效应 量 表达 有 相对 危险 度 
(relative risk, RR)、 优 势 比 (odds ratio, OR)、 绝 对 危险 度 (absolute risk, 4R) 或 NNT 等 ; 当 结 局 观 
察 指标 为 连续 性 变量 资料 、 非 军 发 的 计数 数据 、 较 多 分 类 的 等 级 资料 时 ,效应 量 采 用 均 数 差 什 
(mean difference, MD ) 或 标准 化 均 数 差 值 ( standardized mean difference, SMD ) 等 表达 方式 。 对 于 
较 少 分 类 的 等 级 资料 或 军 发 的 计数 数据 , 可 转化 为 二 分 类 变量 资料 进行 处 理 , 并 选用 相应 的 效 
应 量 ; 对 于 类 似 发 病 密度 的 数据 , 可 以 使 用 risk ratio, 也 简写 成 RR。 对 于 生存 资料 ,效应 量 表达 
可 用 风险 比 (hazard ratio, HR 

在 此 基础 上 , 按照 统一 设计 的 数据 提取 表 , 系统 收集 所 纳入 研究 的 重要 信息 , 如 样本 量 、 分 
析 方 法 、 主 要 结果 变量 、 设 计 方案 、 发 表 年 份 .具体 实施 时 间 及 地 点 、 质 量 控制 措施 等 。 

(三 ) 异 质 性 检验 ( heterogeneity test) 

meta 分 析 之 前 , 应 进行 异 质 性 检验 , 并 根据 异 质 性 检验 结果 ,来 决定 是 否 估计 合并 效应 
量 。 异 质 性 检验 又 称 同 质 性 检验 , 旨 在 检验 多 个 原始 研究 结果 间 的 一 致 性 。 异 质 性 检验 方法 主 
要 有 2 检验 法 与 图 形 目测 法 等 。 若 0 检验 有 统计 学 意义 , 则 表明 存在 统计 学 异 质 性 (statistical 
heterogeneity ), 需要 探讨 异 质 性 的 来 源 并 进行 相应 处 理 。 异 质 性 来 源 主要 从 两 个 方面 考虑 : 一 
是 临床 异 质 性 (clinical heterogeneity ), 如 纳入 研究 在 研究 对 象 、 干 预 措施 、 结局 观察 指标 等 存在 
差异 ; 二 是 方法 学 异 质 性 ( methodological heterogeneity), 如 纳入 了 不 同 设计 方案 、 不 同方 法 学 质 
量 的 原始 研究 等 。 

1. Q 检 验 及 指数 QO 检验 的 无 效 假设 为 : 所 有 纳入 研究 的 效应 量 均 相 同 ( 即 Ho: 6 = 

大 2 

人 94) 9 统计 量 定义 为 :2= 忆 w (0 -5)*, 进 一 步 可 表达 为 :0 =>.w -写生 

上 式 中 mw 为 第 i 个 研究 的 权重 值 。0, 为 第 i 个 研究 的 效应 量 ,5 为 合并 效应 量 ,5 -芳和 
为 纳入 的 研究 个 数 。@ 服从 于 自由 度 为 -1 的 必 分 布 。 车 89>x0-o, 则 P<a, 表明 纳入 研究 


2 x 100%, 用 以 定量 描述 异 








间 的 效应 量 存在 统计 学 异 质 性 , 可 进一步 计算 异 质 指数 7?= 


质 程度 。 若 己 指 数 为 0%~40%, 表明 异 质 性 可 以 忽略 不 计 ; 1?=30%~60%, 表明 存在 一 定 程度 的 
异 质 性 ; 车 1?=50%~90%, 表明 纳入 研究 的 效应 量 存在 较 明显 的 异 质 性 ; 当 7?=75%~100% 时 ， 
表明 异 质 性 明显 , 需 探 讨 异 质 性 来 源 , 考虑 进行 亚 组 分 析 .meta 回归 等 , 甚至 放弃 meta 分 析 。 

例 7-1 在 一 项 有 关 丹 参 治疗 急性 期 脑 卒 中 的 系统 综述 中 , 研究 者 纳入 了 5 个 随机 临床 试 
验 , 结局 观察 指标 为 神经 功能 缺损 改善 率 , 资料 见 表 7-3。 

以 例 7-1 为 例 , 2 检验 法 的 计算 过 程 见 表 7-4, 其 中 @.=InOR, w= 1/Var(InOR,), Var( InOR;)= 
1/a;t+ 1/b;+ l/c;+ 1/d; 

G@=11.769-9.9112/8.679=0.451,u=5-1=4, 忆 >0.10, 异 质 性 检验 无 统计 学 意义 , 还 不 能 说 
明 研 究 效 应 量 间 不 同 质 , R=0%。 

需要 注意 的 是 2 检验 法 的 检验 效能 较 低 , 如 在 纳入 研究 数目 较 少 的 情况 下 , 有 时 不 能 检测 
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表 7-3 ”丹参 治疗 急性 期 脑 卒中 的 疗效 观察 








研究 下 玉照 合计 (N) 
改善 (ai) 未 改善 (b,) 改善 (c) 未 改善 (d) 

Cao(1994) 48 1 45 各 96 

Mao( 2001) 33 3 25 9 70 

Min( 2004) 29 4 22 10 65 

Pan( 1992) 67 2 65 4 138 

Zhang( 2002) 36 4 29 扫 80 


_ Zhang(2002) 3 ”- -一 


表 7-4”Q 统 计量 计算 过 程 (以 OR 为 例 ) 








研究 INOR, Var{ InOR,) Wi wx InOR; wxInOR? 
CAO(1994) 0.758 1.543 0.648 0.491 0.372 
Mao( 2001) 1.376 0.515 1.942 2.672 3.678 
Min( 2004) 1.193 0.43 2.326 2.773 3.307 
Pan( 1992) 0.723 0.78 1.282 0.928 0.671 
Zhang( 2002) 1.228 0.403 2.481 3.047 3.741 

合计 1.142 8.679 9.911 11.769 


A 


出 异 质 性 , 出 现 假 阴 性 结果 , 可 考虑 提高 检验 水 准 ,如 a=0.10， 以 增 大 检验 效能 ; 相反 , 如 果 纳 
人 研究 过 多 , 即使 研究 间 结 果 是 同 质 的 , 也 可 能 出 现 P<a 情况 ， 即 异 质 性 检验 有 统计 学 意义 。 
因此 ,对 QO 检验 结果 的 解释 要 慎重 ， 需要 结合 异 质 指数 了 以 及 森林 图 进行 综合 判断 。 

2. 图 形 法 ”此 外 ,还 有 一 些 图 形 法 用 于 展示 异 质 性 。 如 Forest 图 (森林 图 )、 标 准 化 Z 分 值 
图 、Radial 图 .LAbbe 图 等 。 其 中 通过 目测 森林 图 中 的 可 信 区 间 重 到 程度 , 借以 判断 异 质 性 最 
为 常用 。 若 可 信 区 间 大 部 分 重合 ,无 明显 异常 值 ,一般 可 认定 同 质 性 较 好 。 

(四 ) 合并 效应 量 估计 及 其 假设 检验 

在 异 质 性 检验 的 基础 上 , 选用 适当 的 方法 进行 分 析 。 若 异 质 性 不 明显 ， 同时 假定 理论 效应 
量 为 某 一 固定 值 , 纳入 研究 效应 量 间 的 差异 是 由 机 遇 造 成 的 , 可 采用 固定 效应 模型 (fixed effect 
model) 估 计 合 并 效应 量 ; 若 存在 一 定 程度 异 质 性 , 且 假定 理论 效应 量 不 固定 、 服从 于 某 种 分 布 类 
型 ,如 正 态 分 布 时 , 可 用 随机 效应 模型 估计 效应 量 ; 若 异 质 性 明显 ， 可 考虑 亚 组 分 析 、meta 回归 
分 析 直 至 放弃 汇总 分 析 , 只 对 结果 进行 简单 描述 。 

以 四 格 表 资 料 为 例 ; 演示 合并 效应 量 估计 及 其 假设 检验 过 程 。 鉴 于 此 类 资料 合并 效应 量 的 
估计 方法 较 多 , 诸如 Mantel-Haenszel 法 、 方 差 倒 置 法 (inverse-variance methods ) Peto 法 等 。 现 仅 
以 Mantel-Haenszel 法 为 例 ,加 以 阐述 ( 表 7-5)。 














表 7-5 ”Mantel-Haenszel 法 计算 合并 效应 量 的 具体 过 程 





研究 ad/N bc/Ni OR; 
Cao( 1994) 1.000 0.469 2.138 
Mao( 2001) 4.243 1.071 3.960 
Min( 2004) 4.462 1.354 3.295 
Pan( 1992) 1.942 0.942 2.062 
Zhang( 2002) 4.950 1.450 3.414 





合计 16.596 5.286 3.14 











笔记 
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全 估计 合并 效应 量 及 其 95% 可 信 区 间 ad OR 对 数 的 方差 为 Var( lnORm)= 


ZEbc/N; 
ZPR 二 (PS +OR) 





+) Fos 要 颜 鼓 只 -2 92 
2(ZR) ” 2(ZR)CZS) 2(CS)z ,其 中 ww, pci,d 为 四 格 表 的 实际 频数 ,R， 站 


ait dl bitc 


P=——— 


Ni Crm 则 OR 的 95% 可 信和 区间 为 : exp(InORw 二 1.96VVar(In OR)) 


Zad/N, 
i Zec7N “16.596/5.286=3.14, InOR,w 的 方差 为 : 0.115, 则 ORwy 值 95% 可 信 


区 间 为 1.62~6.10。 


2 合并 效应 量 的 假设 检验 : > 检验 Z= 办 ORw _ 统计 量 z 服 从 于 分 布 (外 文 文献 


尚 夫 一 MVar(ln OR,) 
党 家 未 为 分布) 用 于 检验 合并 效应 量 是 否 有 统计 学 意义 


本 例 z= 1.144/0.387= 3.37, 则 P 了 <0.001, 表明 合并 效应 量 有 统计 学 意义 。 


实际 上 ， 信 计 合并 效应 量 以 及 进行 异 质 性 检验 可 以 借助 一 些 现成 分 析 软 件 来 完成 , 方便 
二 这 其 中 首 推 RevMan 软件 ,图 7.4 则 是 利用 该 软件 对 例 7-1 资料 的 meta 分 析 结果 。 


Experimental Cai Odds Ratio 
trol dds Ratio 村 
Study or Subgrou Events Total Events Total Weight MH Pod 95%6 CI M-H, Fixed, 95% CI 
ne 49045 2.13 [0.19, 24.35] 
Min 0 20.3% 3.96 [0.97, 16.16] 
9 3 x22 32 356% 3.30 [0.91, 11.91] 








Pan 67 69 < 3 
5 69 17.8% 2.06[0.36,11.64] 

36 0 29 40 27.4% 3.41[0.98,11.85] 

Total (95% CI) 

Total events i ig6 222 1000% 314[1.62,610] a 

Heterogeneity: Chi?=0.45, df=4 ( p-0.98 ) ;P=0% tor ol 1 10 100 

Test for overall effect: Z-3.38 (P=0.0007 ) tv i 


图 7-4 基于 RevMan 软件 的 meta 分 析 


国 中 “9” 为 合并 效应 量 图 示 ， “3.14[ 162, 610 了 表示 合并 效应 量 及 其 95% 可 信 区 间 ; z=3.38， 
”0 07 :表示 假设 检验 中 的 统计 量 及 其 P 值 。*Ch?=0.45, d=4,P-0.98”, 表示 异 质 性 检 
验 的 Q 值 及 P 值 , 异 质 指数 =0%。 

(五 ) 固定 效应 模型 与 随机 效应 模型 的 选择 

合并 效应 量 的 估计 模型 包括 固定 效应 模型 (fixed effect model)、 随机 效应 模型 (random effect 
model ) 以 及 最 新 提出 的 质量 效应 模型 ( quality effect model ) 等 。 模型 的 选择 取决 于 异 质 性 检验 结 
到 以 及 对 效应 量变 异 的 理论 假设 。 假 如 异 质 性 检验 无 统计 学 意义 且 ?<40%, 并 假设 总 体 效应 
量 为 一 个 固定 值 时 ,可 认为 理论 效应 量 是 固定 的 , 原始 研究 间 的 效应 量 即使 有 差别 , 也 是 由 于 
抽样 误差 造成 的 , 合并 效应 量 估计 可 选用 固定 效应 模型 ; 当 异 质 性 检验 有 统计 学 意义 (P<0.10) 
且 志 > 50%, 若 假设 合并 效应 量 不 固定 并 服从 于 服从 某 种 分 布 ( 常 假定 为 正 态 分 布 ) 时 , 考虑 先 
用 随机 效应 模型 , 计算 合并 效应 量 。 随 机 效应 模型 因 将 研究 间 的 变异 因子 己 作为 校正 权重 , 其 
结果 比 固定 效应 模型 结果 更 稳健 ,但 可 信 区 间 的 精度 会 有 所 降低 ; 车 异 质 性 明显 (7?>75%), 考 
处 meta 回归 、 亚 组 分 析 , 探讨 异 质 性 来 源 ; 若 临床 异 质 性 过 于 明显 , 则 应 放弃 进行 meta 分 析 , 仅 
作 定 性 描述 。 

1. 固定 效应 模型 ”上 例 数据 类 型 为 典型 的 二 分 类 变量 资料 ,选用 固定 效应 模型 的 MH 法 
估计 得 到 了 合并 效应 量 。 若 遇 到 数值 变量 资料 (连续 性 变量 资料 ), 且 异 质 性 检验 无 统计 学 意义 

yp 时 ,同样 可 选用 固定 效应 模型 进行 meta 分 析 , 具体 过 程 与 二 分 类 变量 资料 相同 , 采用 方差 倒置 
笔记 HA 法 进行 合并 效应 量 估计 。 数 值 变量 资料 的 效应 量 表达 可 以 选择 均 数 差 值 (mean difference, MD) 
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和 标准 化 均 数 差 值 (standardized mean difference， SMD)。 当 纳 入 研究 的 结果 变量 均 采 用 相同 方 
武 测量 与 才 达 时 ,效应 量 表达 可 使 用 均 数 差 值 (MD ), 因 其 带 有 自然 单位 ， 易于 临床 解释 。 而 结 
果 变 量 采 用 不 同 的 度量 衡 单位 或 者 效应 量 大 小 相差 较 大 时 ， 宜 采 用 标准 化 均 数 差 值 (SMD ), 但 
需 谨 慎 解 释 这 类 结果 。 现 以 MD 作为 效应 量 ， 阐述 固定 效应 模型 的 估计 过 程 。 要 

(1) 单个 研究 MD 及 其 95% 可 信 区 间 估 计 : MD 为 均 数 差 值 , 可 表示 为 ;= 太一 阁 ， 其 中 i 
si 为 第 i 个 纳入 研究 中 干预 组 的 均 数 和 标准 差 ， 并,s5 为 第 i 个 研究 中 对 照 组 的 均 数 和 标准 差 ， 
则 可 的 标准 误 为 (si x Si/ ni +s x s/n ) ?eo 

2 
(2) @ 检 验 及 其 1? 指数 :8= Zwd -Se, 进一步 可 计算 异 质 指数 1。 


Zwa 0, 2 
(3) 合并 效应 量 (MD 合并 值 ) 及 其 95% 可 信和 区 间 : de Ew ,其 95% 可 信和 区间 为 qh 并 十 


1.96.| 一 ! ,其 中 wi 为 d 标 准 误 的 平方 。 
Zw 


、 da zl 1 
WY 生生 , SE, 合并 ) 9 
(4) 合并 效应 量 的 假设 检验 : z est #7 
例 7-2 在 万 根 素 治疗 急性 脑 梗死 的 系统 评价 中 ， 研究 者 纳入 分 析 了 4 个 随机 临床 试验 ， 均 


使 用 NIHSS 量 表 测量 了 治疗 前 后 神经 功能 缺损 评分 ， 具体 结果 见 表 7-6。 
表 7-6 神经 功能 缺损 评分 变化 值 meta 分 析 过 程 











组 
研究 可 相 天 浊 ne d wi dw d? Wi 
nr x Ss nr 2 5 
Wu(2003) 30 14.36 18.36 30 19.11 13.41 ee 0.06 —0.28 1.31 
Liu( 2001 ) 50 14.53 17.96 50 20.18 12.41 -5:65 0.10 —0.59 3.35 


Zhao(2004) 22 980 700 23 1230 690 一 5 0.23 —0.58 1.45 
Cao(1999) 30 8.13 2.28 30 -15.00 229 -687 287 -1974 135.59 


合计 132 133 -648 327 -21.19 14170 








本 例 合并 MD 为 -6.48, 其 95% 可 信 区 间 为 -7.57~—5.40。 合 并 MD 假设 检验 z=11.72, 了 < 
—(k—1 
0.00001; 异 质 性 检验 0=4.39, P=0.22， 于 学 意 X,P- 2 x100%=31%。 鉴 于 本 例 
的 异 质 性 检验 结果 无 统计 学 意义 且 异 质 指数 <40%, 考虑 选用 固定 效应 模型 。 同 样 ， 以 该 资料 
为 例 , 可 使 用 RevMan 的 固定 效应 模型 分 析 , 具体 结果 见 图 7-5。 










Experimental Control Mean Difference Mean Difference 
Study or Subgroup, Mean SD Total Mean SD Total Weight IV, Fixed, 95%CI IV, Fixed, 95% CI 
CAO 14.36 18.36 30 19.11 13.41 30 1.8% -4.75 [-12.89, 3.39] 
Liu 14.53 17.96 50 20.18 12.41 50 3.2% -5.65 [-11.70, 0.40] 
Wu 9.8 7 22 123 69 23 7.1% -2.50[-6.56, 1.56] 
Zhao 8&13 228 30 15 2.29 30 87.9% -6.87 [-8.03,-5.71] 图 
Total (95% CD 132 133 100.0% -6.48 [-7.57, -5.40] 


Heterogeneity: Chi2-4.37, df=3 (P=0.22 ) ;P=31% 
Test for overall effect: Z = 11.72 (P<0.00001 ) 


-20 -10 0 10 20 


Favours experimental Favours control 


图 7-5 ”基于 RevMan 软件 的 meta 分 析 


图 中 “人 @” 为 合并 效应 量 的 图 示 ,“-6.48[ -7.57, -5.40 了 表示 合并 效应 量 MD 人 # 及 其 95% 可 
信 区 间 ; 吕 = 1172, 忆 <0.00001": 表示 合并 效应 量 的 假设 检验 结果 及 其 已 值 。“CjP 一 4.37, 哨 一 3， 
P=0.22”, 表示 异 质 性 检验 结果 Q 值 及 其 P 值 。 异 质 指数 ?=31%。 由 于 RevMan 在 估计 过 程 中 


RM 





笔记 
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对 MD 及 标准 误 进行 了 校正 , 结果 与 人 工 计算 略 有 差别 。 

2. 随机 效应 模型 ” 当 异 质 性 检验 有 统计 学 意义 且 假 定 真实 效应 量 不 固定 但 服从 正 态 分 布 
时 , 考虑 选用 随机 效应 模型 (random effect model) 估 计 合并 效应 量 。 随机 效应 模型 就 是 在 固定 效 
应 模型 分 析 的 基础 上 采用 了 DerSimonian-Laird 校正 。 两 类 模型 的 区 别 在 于 加 权 的 方式 不 同 , 固 
定 效应 模型 以 每 个 研究 内 方差 的 倒数 作为 权重 , 而 随机 效应 模型 是 以 研究 内 方差 与 研究 间 变 异 
之 和 的 倒数 作为 权重 , 调整 的 结果 就 是 样本 量 较 大 研究 的 权重 适当 降低 , 而 样本 量 较 小 研究 的 
权重 则 适当 增 大 。 

(1) 二 分 类 变量 资料 的 随机 效应 模型 (random effect model): 该 校正 法 是 由 DerSimonian 和 
Laird 于 1986 年 提出 ,假设 各 原始 研究 的 效应 量 不 尽 相 同 , 以 研究 内 方差 及 研究 间 变 异 之 和 的 
倒数 为 权重 , 并 以 此 估计 合并 效应 量 。 与 固定 效应 模型 相 比 , 主要 步骤 相同 , 依次 估计 单个 研 
究 效应 量 、 合 并 效应 量 及 其 95% 可 信 区 间 , 最 后 进行 假设 检验 。 唯 一 不 同 的 是 需 事先 计算 研究 





可 一 人 (K 一 1 sp Es 
间谍 异国 于 校正 权重 w=(wn+2)7。 其 中 = mex|0, 于 全 诬 各 j| 2 为 异 质 必 好 


i es Q—(k-1) 
验 统计 量 ,k 为 纳 人 分析 的 研究 个 数 。 车 Di-Le-0, 省 0>t-Ler| 2 人 5 





仍 以 四 格 表 资料 为 例 , 使 用 随机 效应 模型 估计 合并 效应 量 及 其 95% 可 信 区 间 : 


1.9 
2 95% 可 信 区 间 为 exp(lnOR 全 并 十 信和 


以 例 7-1 为 例 , 0O=0.451<4, 故 =0, 随机 效应 模型 具体 估计 过 程 见 表 7-7。 


ORa¥=exp( 


表 7-7“ 随 机 效应 模型 的 分 析 结 果 











研究 OR, InOR, WwW, 友 wi INOR;x w; 
CAO(1994) 133 076 0.648 0 0.648 0.491 
Mao( 2001) 3.960 1.38 1.943 0 1.943 2.674 
Min( 2004) 3.295 1.19 2.326 0 2.326 2.774 
Pan( 1992) 2.062 0.72 1.282 0 1.282 0.927 
Zhang(2002) 3.414 1.23 2.480 0 2.480 3.045 


其 中 OR 为 exp(9.911/8.679)=3.133, 其 95% 可 信 区 间 为 1.62~6.10。 由 于 固定 效应 模型 
以 各 研究 内 方差 的 倒数 为 权重 , 而 D-L 校正 法 则 以 研究 内 和 研究 间 变 异 之 和 的 倒数 为 权重 , 所 
以 当 异 质 性 不 明显 时 , 两 种 模型 估计 结果 完全 相同 ; 车 存在 较 明显 的 异 质 性 时 , 结果 会 有 差异 ， 
利用 随机 效应 模型 估计 的 可 信 区 间 明 显 宽 于 固定 效应 模型 的 估计 名 pie 

(2) 数值 变量 (连续 性 变量 ) 资 料 的 随机 效应 模型 : 对 于 数值 变量 (连续 性 变量 ) 资 料 , 固定 
效应 模型 采用 方差 倒 唾 法 进行 估计 ， as DerSimonian-Laird 
校正 





本 | B=) 
校正 权重 wi =(wi'+ 忆 )-1!, 其 中 研究 间 变 异 因子 式 -mo Er lo 


为 异 质 性 检验 统计 量 ,为 纳入 分 析 的 研究 个 数 。 
; 1.96 


MD 合并 值 元 = 兰 沁 全， 其 假设 检验 统计 量 z== -ao _ ,95% 可 信 区 间 ; 9, 96_ 
全 dp; = Ew ,其 假设 检验 统计 量 z je , 95% 可 信和 区 间 |: pL Ew 








以 例 7-2 为 例 , 使 用 随机 效应 模型 重新 分 析 , 具体 结果 见 表 7-8。 
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表 7-8 神经 功能 缺损 评分 变化 值 meta 分 析 过 程 
葛根 素 组 对 照 组 











研究 一 一 不 Wi 人 Wi 
nt Xi Ss’ ne Xi S5 
Wu(2003) 30 14.36 18.36 30 19.11 13.41 -4.75 0.06 1.917 0.05 
Liu(2001) 50 14.53 17.96 50 20.18 12.41 S03 0.10 1.917 0.09 


Zhao(2004) 22 9.80 7.00 23 “12.30 6.90 -2.5 0.23 1.917 0.16 
Cao( 1999) 30 8.13 2.28 30 15.00 2.29” -6.87 2.87 1.917 0.44 





合计 132 133 -5.63 3.27 0.74 


本 例 Q>K 一 1.=(4.39 一 3)/(3.27 一 8.322/3.27)=1.917, 合并 均 数 差 值 : -5.63: 合并 效应 
:==4.87, 了 P<0.001, 说 明 有 统计 学 意义 ; 其 95% 可 信 区 间 为 -7.90~-3.37。 同 汶 可 以 
利用 RevMan 完成 上 述 分 析 , 相对 于 固定 效应 模型 的 结果 (-7.57~--5.40), 显然 随机 效应 模型 的 
















随机 效应 模型 可 以 允许 研究 间 效 应 量 存在 一 定 的 异 质 性 , 并 试图 用 特定 的 权重 系数 来 解释 
这 些 异 质 性 , 所 有 纳入 研究 均 使 用 相同 的 权 行 权重 校正 。 但 备 受 争议 的 是 这 些 权 重 系 
数 也 许 并 无 实 应 
位 研究 者 提出 的 质 最 效 ! 
大 多 与 原始 研究 的 方法 
值 范围 为 0~1, 车 Qi 为 0, 表示 该 原始 研 
MetaXL, 可 以 利用 质量 效应 模型 估计 合并 效应 量 。 

三 、 发 表 性 篇 倚 的 识别 与 分 析 

meia 分 析 为 一 种 二 次 研究 方法 , 即 基于 漂 始 研究 结果 进行 二 次 分 析 。 纳 入 的 原始 研究 是 否 
全 面 无 偏 . 将 直接 影响 meia 分 析 结果 是 可靠。 在 可 能 影响 meta 分 析 结 果真 实 性 的 偏 倚 
中 , 发表 性 偏 倚 的 影响 程度 较 大 且 较 难 控制 ,因而 信 受 关注 。 发 表 性 偏 位 可 使 meta 分 析 过 分 村 
大 治疗 效应 量 或 危险 因素 的 关联 强度 , 导致 临床 个 体 治疗 与 卫生 决策 的 失误 。 
区 是 指 有 统 i 义 的 研究 结果 比 无 统计 学 意义 的 研究 更 容易 投稿 和 被 发 
, 由 此 而 产生 的 偏 倚 。 对 于 无 统计 学 意义 的 研究 , 研究 者 可 能 认为 意义 不 大 , 不 发 表 或 推迟 
发 表 ; 作为 杂志 编辑 则 更 有 可 能 对 这 类 论文 退 稿 、 因 为 存在 发 表 性 偏 倚 , 即使 具备 周密 的 检索 
策略 和 手段 (如 与 研究 者 个 人 联系 ), 也 不 可 能 完全 地 纳入 所 有 相关 研究 。 发 表 性 偏 倚 的 类 型 较 
多 ,常见 的 有 : 中 当 完成 的 临床 试验 得 到 阳性 结果 时 , 因 研 究 者 缺乏 信心 向 国际 知名 的 医学 杂 
志 投 稿 , 而 转投 地 方 性 杂志 。@@ 如 非 英 语 国家 研究 者 , 可 能 发 表 于 本 国 的 地 方 性 杂志 : 但 当 得 
到 阴性 结果 时 , 则 作者 更 床 司 际 性 杂志 上 用 英文 发 表 , 这 种 发 表 性 偏 倚 被 称 为 语 
他 另外 还 有 一 些 论文 不 能 发 表 的 原因 , 如 去 士 、 硕 士 读 完 学 位 而 离开 原来 研究 单位 
全 或 者 -一些 ij 果 可 能 违 音 了 经 费 提供 方 (如 药 企 ) 的 利益 , 被 迫 搁浅 不 能 发 表 。f《 
性 偏 倚 的 另 一 和 兄 是 , 一 些 作 者 为 提高 知名 度 而 一 稿 多 投 , 或 者 作为 多 中 心 研 究 的 参 全 





关 , 提出 了 偏 倚 风 险 概 率 (Qi), 以 其 作为 权重 校正 系数 , Qi 取 
究 质 量 高 ,无 偏 倚 发 生 风 险 。 目 前 已 有 一 款 狗 费 软件 
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和 
境 有 三 类 比较 简单 的 分 析 方 法 : 即 漏斗 图 法 、 剪 补 法 以 及 公式 法 可 以 用 来 正确 识别 与 处 理 
发 表 性 偏 税 。 其 中 以 漏斗 图 法 最 为 常用 , 它 是 基于 样本 含量 (或 效应 量 标准 误 的 倒数 ) 与 效应 
量 (或 效应 量 对 数 ) 所 绘制 的 散 点 图 。 效 应 量 可 用 RR, OR, RD 或 者 RR、OR 的 对 数值 等 。 漏 斗 
图 的 前 提 假 设 是 效应 量 估 计 值 的 精度 随 着 样本 量 的 增 大 而 提高 , 其 变化 范围 也 随 精度 的 增加 而 
逐渐 变 罕 , 最 后 趋 近 于 点 状 , 其 形状 类 似 一 个 对 称 倒置 的 漏斗 , 故 称 为 漏斗 图 。 即 样本 量 小 的 
全 究 , 数量 多 .精度 低 , 分 布 在 漏斗 图 的 底部 呈 左 右 对 称 排列 ; 样本 量 大 的 研究 , 精度 高 , 分 布 在 
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漏斗 图 的 顶部 , 且 向 中 间 ( 合 并 效应 量 ) 集 中 。 利 用 漏斗 图 可 以 直接 观察 原始 研究 的 效应 量 估计 
值 是 否 与 其 样本 含量 有 关 。 当 存在 发 表 性 偏 倚 时 , 漏斗 图 往往 呈现 不 对 称 的 偏 态 分 布 ( 网 7-6)。 
但 绘制 漏斗 图 , 需要 纳入 较 多 的 研究 个 数 , 原则 上 要 求 5 个 以 上 才能 进行 。 
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图 7-6 ”漏斗 示意 图 


| 图 7-6 所 示 假 设 为 漏斗 图 的 两 种 情况 , 左 图 中 所 有 研究 围绕 中 心 线 对 称 排列 , 表明 没有 发 表 
| 性 偏 倚 , 图 中 空心 散 点 代表 结果 无 效 的 小 样本 研究 ,小 样本 研究 估计 的 效应 量变 异 较 大 ,出现 效 
应 量 极端 值 机 会 要 多 于 大 样本 研究 ; 右 图 , 呈 不 对 称 分 布 , 表示 存在 发 表 性 偏 倚 , 所 缺失 部 分 恰 
恰 为 结果 无 统计 学 意义 的 小 样本 研究 。 基 于 例 7-1 资料 , 利用 RevMan5 绘制 漏斗 图 (图 7-7 )。 
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图 7-7 例 7-1 漏 斗 图 


图 7-7 显示 所 有 研究 围绕 中 心 线 对 称 排列 ， 表明 发 表 性 偏 倚 不 明显 , 对 meta 分 析 结 果 的 影 
响 可 以 忽略 。 

除 漏斗 图 法 外 , 也 可 以 进行 Egger 回归 、Begger 分 析 以 及 计算 失效 安全 数 (fail-safe number) 
| 等 ,用 以 评估 发 表 性 偏 倚 。 前 者 分 析 需 要 借助 一 些 特定 的 软件 ,如 Stata 等 。 
| 四 、meta 回归 及 其 他 一 些 方法 学 进展 
| 在 临床 研究 中 , 即使 研究 目的 完全 相同 , 总 会 或 多 或 少 地 存在 一 些 差 别 。 如 在 药物 生产 厂 
”家 .剂量 ,研究 对 象 特征 .病情 轻重 ,测量 时 间 、 随 访 时 间 等 方面 有 所 不 同 , 这 些 都 是 异 质 性 的 洪 
在 来 源 。 若 这 些 因 素 能 够 被 准确 测量 , 可 以 选用 meta 回归 模型 ,估计 合并 效应 量 。 
| 0.=Po+B x Xt*t+p, x Kpte 
| 其 中 p, 为 固定 效应 量 。 若 无 混杂 的 影响 ,Pi1,…, Ps=0, 则 meta 回归 模型 可 简化 为 固定 效 
应 模型 。meta 回归 模型 可 适用 于 RCT 及 病例 对 照 研究 等 研究 类 型 , 也 可 用 于 敏感 性 分 析 。 但 
meta 回归 容易 产生 聚集 性 偏 倚 , 特别 是 当 资 料 不 齐 或 纳入 分 析 的 研究 数目 较 少 时 , 如 小 于 10 个 
时 ,不宜 进 行 meta 回归 分 析 。 
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尽管 上 述 回归 模型 中 考虑 了 一 些 混杂 因素 , 仍 不 能 完全 解释 研究 间 的 变异 , 可 进一步 在 模 

型 中 加 入 随机 效应 项 , 那么 该 模型 就 成 为 混合 效应 模型 。 
0=PotPB1 XX t+p, * Xpt+ ut er 

其 中 wu 为 随机 效应 项 。 混 合 效应 模型 的 参数 估计 可 采用 加 权 最 小 二 乘法 或 极 大 似 然 估计 
法 , 可 以 用 来 解释 已 知 的 异 质 性 来 源 。 但 存在 两 大 缺点 : 一 是 如 果 研 究 数 目 较 少 , 如 小 于 10 个 ， 
则 不 能 建立 混合 效应 模型 ; 二 是 不 能 进行 剂量 反应 回归 分 析 等 。 

除 meta 回归 模型 与 混合 效应 模型 外 , 其 他 相关 的 方法 还 有 : 累积 meta 分 析 、 和 迭代 随机 效应 
模型 、 多 水 平 meta 模型 以 及 贝 叶 斯 meta 分 析 等 。 

五 、 慎 重 应 用 与 评价 meta 分 析 的 结果 

(一 ) 异 质 性 检验 与 处 理 

若 研究 间 有 足够 的 同 质 性 , 选用 合适 的 模型 (如 固定 效应 模型 或 随机 效应 模型 ,两 者 均 可 ) 
佑 计 合并 效应 量 ; 若 存在 异 质 性 生来 源 已 知 , 采用 meta 回归 模型 或 亚 组 分 析 , 估计 合并 效应 量 。 
车 异 质 性 检验 有 统计 学 意义 但 异 质 性 来 源 未 知 , 当 假设 研究 间 效 应 量 虽 不 固定 , 但 服从 正 态 分 
布 时 , 应 选择 随机 效应 模型 的 估计 结果 ; 若 异 质 性 过 大 , 应 放弃 meta 分 析 , 只 对 结果 作 一 般 性 

(二 ) 考察 meta 分 析 结 果 的 稳健 性 

考察 meta 分 析 结 果 的 稳健 性 ,常常 采用 敏感 性 分 析 。 敏 感性 分 析 (sensitivity analysis ) 即 通 
过 改变 纳入 标准 (特别 是 那些 尚 有 争议 的 研究 和 排除 低 质量 的 研究 、 或 采用 不 同 统计 方法 / 模 
型 分 析 同一 组 资料 , 观察 meta 分 析 结果 的 变化 情况 , 借以 考察 结果 的 稳定 性 如 何 。 如 在 排除 某 
个 低 质量 研究 后 , 重新 估计 合并 效应 量 , 并 与 未 排除 前 的 meta 分 析 结 果 进 行 比较 , 探讨 该 研究 
对 合并 效应 量 影响 程度 及 结果 稳定 性 。 车 排除 后 的 结果 未 发 生 大 的 变化 , 说 明敏 感性 低 , 结果 
较为 稳健 可 信 ; 相反 , 若 排除 后 得 到 差别 较 大 甚至 截然 相反 结论 , 说 明敏 感性 高 ,结果 的 稳健 性 
,在 解释 结果 和 下 结论 时 应 非常 慎重 , 提示 存在 与 干预 措施 效果 相关 的 、 重 要 的 、 潜 在 的 偏 倚 
因素 , 需 进一步 明确 争议 的 来 源 。 

(三 ) meta 分 析 结 果 的 适用 性 

合并 效应 量 实际 上 是 多 个 原始 研究 效应 量 的 加 权 平 均值 , 因此 meta 分 析 的 结果 在 推广 应 
用 时 , 应 注意 个 体 对 象 的 特征 及 生物 学 或 文化 变异 干预 场所 .干预 措施 及 依从 性 、 有 无 辅助 治 
疗 等 。 不 宜 推荐 没有 meta 分 析 证 据 支 持 的 建议 。 在 无 肯定 性 结论 时 , 应 注意 区 别 两 种 情况 , 是 
证 据 不 充分 而 无 定论 , 还 是 有 证 据 表明 确实 无 效 。 

《四 ) meta 分 析 结 果 的 时 效 性 

同系 统 评 价 (综述 ) 一 样 , meta 分 析 的 结论 同样 不 是 一 成 不 变 的 . 它 只 是 对 现 有 资料 综合 分 
析 的 结果 , 随 着 新 的 研究 资料 的 不 断 纳 入 , 其 结论 应 加 以 更 新 。 


第 四 节 ”系统 评价 的 评价 原则 


近年 来 , 系统 评价 或 meta 分 析 的 数量 明显 增多 ,方法 日 趋 复杂 , 对 临床 医务 工作 者 和 卫生 决 
策 者 也 产生 了 重要 影响 。 但 一 篇 系统 评价 或 meta 分 析 . 并 不 表示 其 结论 的 绝对 真实 、 可 靠 。 有 
研究 者 从 与 meta 分 析 质 量 有 关 的 6 个 方面 (研究 设计 、 不 同 研究 的 可 合成 性 、 偏 倚 的 控制 、 统 计 
分 析 方 法 、 敏 感性 分 析 、 应 用 性 ) 对 86 篇 基于 随机 对 照 试验 的 meta 分 析 进 行 了 评价 , 结果 发 现 
仅 28% 的 meta 分 析 合格 。 因 此 ,读者 在 阅读 或 应 用 系统 评价 或 meta 分 析 的 结论 指导 临床 实践 
前 , 必须 对 其 方法 和 每 一 个 步 又 进行 严格 评价 以 确定 系统 评价 的 结论 是 否 真实 、 可 信 , 否则 有 
可 能 被 误导 。 评 价 治疗 性 研究 系统 评价 的 基本 原则 可 分 为 三 方面 : 
































第 七 章 ， 医学 研究 证 据 的 系统 评价 与 meta 分 析 


评价 的 结果 是 否 真实 


(一 ) 是 否 栓 据 随 机 对 照 试 验 进 行 的 系统 评价 
作为 评价 干预 措施 疗效 “和 标 讨 方案 ” 的 随机 对 照 试验 , 如 能 很 好 地 控制 各 和 储 偏 倚 内 
素 的 影响 , 由 此 产生 同 质 性 好 的 系统 评价 被 认为 是 论证 强度 最 高 的 研究 证 据 。 而 根据 非 问 质 










RCTs 及 非 随机 对 照 试 验 进 行 的 系统 评价 易 受 偏 倚 因 素 的 影响 , 其 系统 评价 的 论证 强度 必然 
降低 。 
《二 ) 是 否 采用 广泛 和 详细 的 检索 策略 检索 相关 文献 







否 全 面 。 由 于 标识 不 完整 ,一 
丛 的 50% , 而 发 









从 作者 报告 的 文 
检索 数据 库 如 MEDL 


索 方 法 中 可 明确 收集 的 文献 
仅 能 检 出 兰 中 收录 戎 机 对 
章 更 易 发 表 的 现象 可 能 导致 系统 评价 出 现 假 阳性 结果 。 因 此 , 全 面 的 文献 检索 应 
杂志 、 检 索 会 议论 文集 、 学 位 论文 、 厂 家 数据 库 和 与 已 发 表 文献 作者 联系 。 此 外 ， 如 果 文献 检索 
时 限制 语种 , 也 可 能 影响 系统 评价 结论 。 目 前 , 多 数 杂 志 均 要 求 系统 评价 作者 按照 PRISMA 声 声 
明 规范 报告 系统 评价 和 meta 分 析 全 文 , 其 中 包含 检索 流程 图 , 要 求 详 细 陈 述 检索 结果 和 筛选 流 
程 , 有 助 于 读 考 判断 检索 的 完整 性 和 筛选 的 合理 性 。 收 集 的 文献 越 系统 、 全 面 , 则 结论 受 发 表 
偏 倚 的 影响 就 越 小 , 可 信和 度 就 越 大 。 

(三 》 是 否 评估 纳入 的 单个 研究 的 真实 性 

由 于 系统 评价 多 为 对 原始 文献 资料 的 再 分 析 和 总 结 , 因此 ,除了 进行 系统 评价 的 方法 要 严 
格外 ,原始 文献 的 质量 非常 重要 。 所 以 文中 应 详细 描述 评价 单个 研究 文献 质量 的 方法 , 最 好 为 
多 人 独立 评价 并 有 良好 的 一 致 性 。 

(四 ) 是 否 采用 单个 病例 资料 (或 每 个 研究 的 合成 结果 ) 进 行 meta 分 析 

采用 单个 病例 资料 进行 的 meta 分 析 被 认为 是 meta 分 析 的 标尺 (yardstick ), 具有 根据 各 研究 
合成 结果 进行 meta 分 析 不 具备 的 优势 , 如 对 来 自 不 同 研究 的 结果 采用 一 致 的 定义 和 分 界 点 ,能 
从 病人 水 平分 析 异 质 性 并 进行 生存 分 析 , 用 通常 确定 的 亚 组 进行 分 析 以 检验 和 提出 很 设 、 通 过 
与 试验 者 联系 可 详细 核查 和 反复 校正 资料 ， 以 明确 中 机 化 和 跑 访 资料 的 质量 , 通过 现 有 病例 记 
录 系 统 (诸如 死亡 登记 ) 更 新 随访 信息 等 , 将 系统 篇 竺 和 机 明 的 影响 减 至 最 小 程度 。 


二 、 系 统 评价 的 结果 是 否 重要 


(一 ) 不 同 研究 的 结果 是 否 一 致 

如 果 纳 和 系统 评价 的 每 个 临 i 床 研究 ,其 治疗 效果 相似 或 至 少 疗效 的 方向 一 致 , 则 由 此 合成 
的 结果 的 可 人 et 作者 应 对 各 个 研究 结果 之 间 的 相似 性 , 即 进 行 同 质 性 检验 。 如 时 
同 质 性 检验 有 统计 学 差异 , 则 应 解释 差异 的 原因 并 考虑 合成 结果 是 否 论 当 。 

C= ee 效 大 小 、 疗 效 的 精确 性 如 何 

在 进行 结果 合成 时 , 不 能 通过 简单 比较 阳性 研究 结果 和 阴性 研究 结果 的 钱 究 个 数 来 确定 系 
统 评价 的 结论 , 而 应 该 根据 研究 的 质量 和 样本 含量 的 大 小 对 不 同 研究 给 予 不 同 的 权重 值 , 并 采 
用 恰当 的 指标 如 优势 比 (odds ratio )、 相 对 危险 度 (relative risk) 均 数 差 值 (mean difference)、 防 止 
一 例 事 件 发 生 需 要 治疗 同类 患者 的 例 数 (NNT) 和 统计 方法 如 随机 效应 模型 和 回 定 效应 模型 等 
合成 结果 , 同时 计算 相应 的 可 信 区 间 。 


三 、 系 统 评价 的 结果 是 否 能 应 用 于 我 的 患者 
系统 评价 报告 的 结果 是 所 有 研究 对 象 的 “平均 效应 ”, 而 你 主管 的 患者 不 一 定 在 研究 对 
象 的 范围 内 , 因此 在 考虑 系统 评价 的 结果 能 否 应 用 于 你 主管 的 具体 患者 时 应 从 四 个 方面 进行 


考虑 : 
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〈 一 ) 我 的 患者 是 否 与 系统 评价 中 的 研究 对 象 差异 较 大 , 导致 结果 不 能 应 用 于 我 的 患者 (ls 
our patient so different from those in the study that its results cannot apply) 
可 通过 比较 我 的 患者 与 系统 评价 中 的 研究 对 象 在 性 别 、 年 龄 合并 症 、 疾 病 严 重 程度 、 病 
程 、 依 从 性 、 文 化 背景 社会 因素 、 生 物 学 及 临床 特征 等 方面 的 差异 , 并 结合 临床 专业 知识 综合 
判断 结果 的 推广 应 用 性 。 
(二 ) 系统 评价 中 的 干预 措施 在 我 的 医院 是 否 可 行 (ls the treatment feasible in our setting) 
由 于 技术 力量 设备 条 件 、 社 会 经 济 因素 的 限制 , 即使 系统 评价 中 的 干预 措施 效果 明显 ,有 
时 在 自己 所 在 的 医院 却 不 能 实施 , 难以 应 用 于 患者 。 
(三 ) 自己 的 患者 从 治疗 中 获得 的 利 次 如 何 (What are our patient's potential benefits and 
harms from the therapy) 
任何 临床 决策 必须 权衡 利 夷 和 费用 ,只 有 利 大 于 兹 且 费 用 合理 时 才 有 价值 应 用 于 患者 。 例 
如 : 告诉 一 名 患者 其 患 病 的 真实 情况 有 助 于 早期 治疗 和 获取 患者 的 配合 , 但 也 增加 了 患者 的 心 
里 负担 , 可 能 降低 生存 质量 。 
(四 ) 对 于 治疗 的 疗效 和 不 良 反 应 , 自己 患者 的 价值 观 和 选择 如 何 (What are our patient's 


values and preferences for both the outcome we are trying to prevent and the side-effects we 








ha 


may cause) 
循 证 医学 强调 , 任何 医疗 决策 的 制定 应 结合 个 人 的 专业 知识 和 经 验 、 当 前 最 佳 的 研究 证 据 和 和 患 
者 的 选择 进行 综合 考虑 ,应 以 “病人 ”为 中 心 而 不 是 单纯 治 病 , 目前 越 来 越 强调 患者 参与 医疗 决策 。 
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一 、 临 床 医疗 的 需要 
随 着 循 证 医学 的 兴起 , 强调 任何 医疗 决策 的 制定 应 遵循 和 应 用 科学 研究 结果 , 即 应 将 个 人 
的 临床 专业 知识 与 现 有 的 最 好 临床 研究 证 据 结合 起 来 进行 综合 考虑 , 为 每 个 患者 作出 最 佳 的 诊 
治 决策 。 除 了 高 质量 的 原始 论著 外 , 系统 评价 的 广泛 应 用 正 不 断 地 改进 和 规范 着 医务 工作 者 的 
医疗 实践 行为 。 例 如 : 美国 的 政策 研究 所 常 应 用 系统 评价 的 结果 制定 临床 实践 指南 。 有 关 为 低 
血 容 量 、 烧 伤 和 低 蛋 白 血 症 患者 常规 补充 白 蛋 白 的 系统 评价 发 现 , 该 种 疗法 导致 英格兰 和 威 尔 
士 的 死亡 人 数 每 年 增加 1000~3000 人 ,这 一 结果 引起 了 临床 医师 、 科 研 人 员 和 卫生 决策 者 的 极 
大 关注 , 并 呼吁 禁止 盲目 使 用 白 蛋 白 。 英 国 伦敦 St George 医院 根据 Cochrane 系统 评价 结果 改 
变 了 急性 哮喘 的 治疗 方案 , 预计 一 年 可 节约 成 千 上 万 英镑 。 
二 、 科 研 工作 的 需要 
临床 科研 要 具有 先进 性 、 新 颖 性 和 临床 价值 , 面 对 浩瀚 的 医学 文献 信息 , 研究 人 员 必 须 查 
寻 、 阅 读 和 评价 相关 领域 的 文献 资料 , 掌握 研究 课题 的 历史 、 现 状 、 发 展 趋势 .存在 问题 、 当 前 研 
究 的 热点 与 矛盾 , 提出 选 题 、 立 题 的 依据 , 避免 重复 前 人 的 工作 , 为 研究 工作 提供 信息 资料 和 研 
究 方向 。 目 前 , 许多 国家 都 非常 重视 高 质量 系统 评价 在 临床 科研 中 的 价值 。 例 如 , 英国 国家 医 
学 研究 会 资助 的 临床 试验 , 要 求 申请 者 回答 是 否 已 有 相关 的 系统 评价 及 其 结论 如 何 , 如 果 没 有 
相关 系统 评价 或 现 有 的 系统 评价 没有 明确 结论 而 需要 进一步 研究 , 就 会 邀请 系统 评价 的 作者 参 
与 临床 试验 申请 书 的 评审 。 





三 、 反 映 学 科 新 动态 
围绕 专业 发 展 的 热点 ,纵览 某 一 领域 的 最 新 文献 资料 , 作 好 有 关 专 题 的 系统 评价 , 全 面 、 深 
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入 和 集中 地 反映 该 领域 目前 的 动态 和 趋势 、 存 在 的 问题 和 发 展 的 方向 , 以 促进 学 科 的 发 展 , 保 
证 不 断 地 吸收 新 知识 、 新 营养 而 居于 学 科 的 前 沿 位 置 。 


四 、 医 学 教育 的 需要 


医学 教育 除了 向 医学 生 传授 各 种 疾病 的 共同 规律 和 特性 方面 的 知识 外 , 还 应 该 及 时 传授 某 
一 疾病 的 最 新 进展 以 及 新 药物 、 新 技术 的 发 展 情况 。 教 科 书 由 于 出 版 周期 长 , 常常 难以 反映 最 
新 动态 。 因 此 , 医学 教育 者 需要 不 断 地 阅读 有 关 医 学 文献 以 更 新 知识 。 而 系统 评价 是 快速 获取 
有 关 知 识 的 途径 之 一 。 此 外 , 撰写 医学 教科 书 也 应 吸纳 系统 评价 证 据 。 

另外 , 广大 的 基层 医务 工作 者 , 由 于 工作 繁忙 、 文 献 资源 有 限 , 为 了 知识 的 不 断 更 新 , 可 通 
过 阅读 有 实用 价值 的 、 真 实 可 靠 的 系统 评价 , 作为 学 习 新 知识 的 继续 教育 资源 。 


五 、 卫 生 决 策 的 需要 


随 着 人 口 增长 、 年 龄 老化 、 新 技术 和 新 药物 的 应 用 、 人 类 健康 需求 层次 的 提高 , 使 有 限 卫生 
资源 与 无 限 增长 的 卫生 需求 之 间 的 矛盾 日 益 加 剧 , 要 求 各 级 卫生 管理 人 员 制 定 卫生 决策 时 应 以 
科学 、 可 靠 的 研究 结果 为 依据 , 合理 分 配 卫生 资源 , 提高 有 限 卫生 资源 的 利用 率 。 目 前 许多 国 
家 在 制定 卫生 决策 时 均 要 以 医学 文献 资料 特别 是 系统 评价 为 依据 。 例 如 : 1990 年 , 魁北克 的 卫 
生 技 术 评 估 委 员 会 发 表 了 一 篇 有 关 使 用 造影 剂 后 发 生 副 作用 的 meta 分 析 。 报 告 明确 指出 , 没 
有 证 据说 明 使 用 高 渗 造 影 剂 比 低 渗 造影 剂 更 增加 生命 危险 , 仅 严重 副作用 的 发 生 率 稍 有 增加 。 
这 一 结果 的 公布 使 魁北克 在 1990 一 1992 年 间 因 使 用 低 渗 造影 剂 的 医疗 费用 明显 降低 , 净 节 约 
(除去 处 理 严重 副作用 的 费用 ) 约 1200 万 美元 , 即使 保守 估计 , 也 可 节约 1000 万 美元 左右 。 

总 之 , 采用 科学 、 严 格 的 方法 产生 的 系统 评价 能 为 临床 医疗 实践 、 医 学 教育 、 科 研 和 卫生 决 
策 提供 真实 可 靠 的 信息 , 但 在 应 用 系统 评价 的 结论 时 应 该 进行 严格 评价 。 

(村 静 康德 英 ) 
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第 一 节 ”病因 与 危险 因素 研究 的 意义 


疾病 的 病因 学 研究 一 直 都 是 医学 探索 的 一 个 重要 领域 。 基 础 、 临 床 和 预防 医学 各 科 专 家 都 
致力 于 疾病 病因 的 研究 ,但 不 同学 科研 究 病因 的 方法 、 手 段 , 考虑 问题 的 角度 各 有 不 同 , 甚至 对 
病因 概念 的 理解 及 用 于 判断 病因 的 标准 也 不 一 致 , 因此 , 我们 会 在 医学 教科 书 中 病因 ( etiology )、 
发 病 机 制 (pathogenesis)、 致 病 机 制 (mechanisms)、 危险 因素 (risk factor) 等 多 个 标题 下 看 到 有 关 
病因 的 论述 。 如 流行 病 学 是 从 群体 的 角度 , 应 用 概率 论 和 逻辑 推理 的 方法 探索 疾病 的 病因 和 疾 
病 发 生 的 影响 因素 ; 而 在 临床 实践 中 , 任何 一 种 干预 措施 , 包括 手术 和 药物 ， 都 可 能 引起 严重 程 
度 不 等 的 不 良 反应 , 研究 不 良 反 应 , 实质 上 也 是 确定 因果 关系 , 只 是 此 处 的 “ 因 ” 是 指 临床 医生 
在 疾病 预防 、 诊 治 过 程 中 采用 的 各 种 措施 和 方法 , 如 诊断 技术 、 手 术 和 药物 等 。 

病因 学 研究 探索 的 是 疾病 发 生 的 原因 及 相关 因素 间 的 相互 效应 和 各 因素 对 疾病 发 生 、 发 展 
的 影响 。 

在 病因 学 研究 (因果 关系 研究 ) 中 , 必须 强调 的 一 点 是 : 任何 与 结局 (疾病 ) 有 关联 的 原因 性 
暴露 都 必 在 结局 发 生 之 前 。 但 发 生 在 结局 (疾病 ) 之 前 的 暴露 未 必 就 是 病因 。 病 因 学 研究 是 正 
确认 识 疾 病 发 生 和 流行 规律 的 基础 , 也 是 临床 正确 诊断 、 治 疗 和 预防 的 科学 基础 , 同时 可 为 医 
学 决策 提供 依据 , 从 而 获得 疾病 防治 的 最 大 效益 。 其 研究 意义 表现 在 以 下 几 个 方面 : 

一 、 有 助 于 疾病 的 临床 诊断 与 治疗 

通过 病因 学 研究 弄 清 病 因 , 掌握 其 发 病 机 制 和 转 归 , 会 帮助 医师 对 患者 进行 正确 的 诊断 和 
治疗 。 对 疾病 需要 对 因 治 疗 , 力求 治本 , 从 而 获得 好 的 疗效 。 

医师 在 临床 诊疗 过 程 中 , 面 对 患 者 的 实际 情况 , 总 要 探讨 可 能 致 病 的 直接 病因 和 人 危险 因素 ， 
有 针对 性 地 进行 相关 的 体检 和 化 验 检查 , 得 到 必要 的 信息 , 进行 临床 综合 分 析 , 力求 获得 准确 
的 病因 诊断 , 从 而 有 利于 实施 更 有 效 的 治疗 。 

如 果 通 过 现代 的 医学 手段 而 未 能 明确 病因 的 某 种 疾病 , 特别 是 对 于 人 民 健 康 危害 性 显著 
者 , 为 了 有 效 防 治 , 务必 从 病因 及 发 病 的 危险 因素 研究 着 手 。 例 如 : 我 国 在 20 世纪 50 年 代 的 
某 些 地 区 于 秋收 季节 , 发 生 了 钩 端 螺 旋 体 病 的 流行 , 其 中 ,有 许多 重症 病例 , 发 生 肺 大 出 血 而 死 
亡 , 当初 怀疑 “ 肺 鼠 疫 " 流行 ,采取 了 若干 重大 防疫 措施 , 也 造成 了 一 些 不 必要 的 影响 , 后 来 弄 清 
了 该 病 系 钩 端 螺旋 体感 当 所 致 。 当 病因 弄 明 白 后 , 采取 了 有 针对 性 地 对 患者 的 临床 治疗 及 人 群 
预防 , 从 而 大 大 地 提高 了 钩 端 螺 旋 体 病 的 防治 能 力 , 有 力 地 保障 了 人 民 健 康 。 


二 、 有 助 于 疾病 的 预防 


病因 学 研究 结果 , 不 仅 有 助 于 临床 诊断 与 治疗 , 对 于 疾病 的 预防 , 同样 有 用 。 通 过 各 种 媒 
介 , 对 社区 人 群 进行 健康 教育 , 从 而 让 社区 人 群 了 解 疾 病 的 病因 和 危险 因素 , 提高 他 们 对 疾病 
病因 和 有 效 预 防 措施 知识 的 认 知 程度 , 并 有 意识 地 改变 自己 的 生活 方式 和 行为 , 从 而 预防 疾病 
的 发 生 。 

对 于 某 些 急性 传染 病 , 常 为 特异 性 的 病原 生物 体 致 病 , 病因 一 旦 明确 , 可 以 研究 特异 性 高 、 
免疫 力 强 的 疫苗 , 进行 人 群 有 效 预防 , 如 天 花 、 麻 疹 、 乙 脑 、 兰 髓 灰质 炎 、 肝 炎 等 疫苗 。 同 时 , 病 
原生 物体 的 确定 , 又 可 研制 特异 度 高 的 诊断 试剂 , 进而 又 提高 了 疾病 的 诊断 水 平 。 
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第 二 节 ”病因 与 危险 因素 研究 的 基本 概念 


人 类 对 疾病 病因 的 认识 是 一 个 循序 渐进 的 过 程 , 先后 经 历 了 单一 病因 论 及 多 病因 论 两 个 

阶段 。 
一 、 病 因 与 危险 因素 

(一 ) 疾病 病因 概念 的 发 展 

无 论 中 国 或 外 国 , 古代 人 常 将 疾病 归 因 于 鬼神 、 上 帝 及 天 意 ,平日 靠 求 神 拜 佛 或 祈祷 , 以 其 
消 灾 除 病 。 公 元 前 5 世纪 , 由 中 国 古 代 哲 学 思想 中 衍生 出 了 阴阳 五 行 学 说 金 、 木 、 水 、 火 、 
土 ,并 用 这 一 学 说 去 解释 人 体 生 理 现象 和 病理 变化 的 规律 ,将 疾病 的 发 生 与 外 环境 的 物质 
金 、 木 .水 、 火 、 土 联系 起 来 ,从 而 产生 了 朴素 唯物 主义 的 病因 观 。 公 元 前 5 上 世纪, 在 西方 也 出 现 
了 类 似 的 观点 ,反映 在 Hippoerates 所 著 的 On Airs, Waters and Places 之 中 。 他 们 还 认为 , 与 水 、 
土 及 风 等 有 关 , 夏季 有 脾 肿 大 、 发 热 及 腹泻 ,冬季 常 引起 生 痰 及 喉 晰 哑 。 由 此 可 郊 , 在 古代 国内 
外 医家 们 都 注意 到 疾病 与 环境 有 密切 关系 。 我 国 古代 早 就 认为 山 问 的 “ 阅 气 ”是 症 疾 的 原因 。 
19 世纪 上 半 叶 , Sydenham 等 人 关于 疾病 的 “ 冶 气 学 说 (miasma theory ) 在 西方 盛行 。 人 们 认为 
不 洁 的 水 和 土壤 里 散发 出 来 的 污浊 之 气 ( 冶 气 ) 是 使 人 发 病 的 原因 。 故 而 强调 应 设法 清除 贫民 
写 和 其 他 不 卫生 的 地 方 的 “ 冶 气 ”, 以 期 减少 疾病 。 

1. 单一 病因 论 ”意大利 Fracastoro( 1479 一 1553 ) 最 早 提出 : 特异 的 疾病 与 特异 的 “传染 物 ” 
有 关 。 拉 开 了 特异 病因 论 的 开端 。19 世纪 , 随 着 疾病 微生物 理论 的 发 展 , Henle 和 他 的 学 生 
Koch 提出 了 推断 独特 的 活 微生物 导致 特异 疾病 的 Henle-Koch 原理 ， 对 推动 人 类 病因 学 研究 作 
出 了 巨大 的 贡献 。 该 法 则 共有 4 条 : 病原 微生物 必然 存在 于 患 病 动物 体内 ， 但 在 健康 动物 体 
内 不 应 出 现 ; @@ 从 患 病 动物 分 离 得 到 的 病原 微生物 可 以 做 纯 培 养 ; 图 将 分 离 出 的 纯 培 养 物 人 工 
接种 易 感动 物 , 会 出 现 该 疾病 所 特有 的 症状 ; @ 从 人 工 接种 的 被 感染 的 动物 体内 可 以 再 次 分 离 
出 性 状 与 原 有 病原 微生物 相同 的 纯 培养 物 。Koch 于 1876 年 证 明 痰 将 病 符合 这 一 原理 , 随后 许 
多 传染 性 疾病 也 得 到 了 证 实 。 该 理论 在 病因 学 的 发 展 史 上 是 革命 性 的 ， 为 干预 措施 的 实施 铺 平 
了 道路 。 

尽管 这 个 法 则 有 些 绝对 化 , 但 却 反映 出 当时 人 们 在 病因 认识 方面 有 不 小 的 进步 , 即 病原 微 
生物 是 传染 病 的 必要 病因 , 而 且 每 种 传染 病 都 有 自己 的 特异 的 病原 微生物 。 这 是 关于 疾病 的 生 
物 学 病因 的 重要 萌芽 。 随 着 19 世纪 末期 微生物 学 的 出 现 和 发 展 , 人 们 形成 了 这 样 的 概念 , 即 每 
一 种 疾病 必定 是 某 一 种 特异 的 病原 物 所 致 。 这 就 是 疾病 单一 病因 论 的 “特异 病因 学 说 "”。 但 是 
它 并 不 能 解释 复杂 的 病因 效应 。 因 为 即使 是 单一 的 病因 , 也 可 以 引起 多 种 ; 更 不 用 说 绝 大 
多 数 疾病 的 发 生 与 多 种 因素 共同 发 生 作用 有 关 的 情况 , 其 忽视 了 社会 和 环 # 对 疾病 的 影 
响 作 用 , 因此 , 单一 病因 论 有 其 明显 的 局 限 性 。 

2. 多 病因 论 ”医学 研究 人 员 在 长 期 的 疾病 防治 实践 中 逐渐 发 现 , 疾病 的 产生 开 不 完全 依 
赖 特异 的 病原 物 , 还 和 环境 及 人 体 自身 的 多 种 因素 有 关 。 如 在 一 些 非 传染 性 疾病 的 病因 学 研 
究 中 发 现 , 一 种 疾病 的 发 生 往往 是 多 种 因素 综合 作用 的 结果 , 而 且 多 种 致 病因 素 同 时 存在 的 危 
害 性 要 比 其 中 单一 因素 存在 时 严重 得 多 。 这 是 由 于 它们 在 人 体内 的 致 病 效 应 上 , 会 产生 交互 作 
用 。 即 使 是 传染 病 的 发 生 , 也 与 多 种 因素 共同 作用 有 关 。 如 肺结核 , 其 发 生 固然 需要 有 结 
等 均 参 与 人 体 肺 
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核 分 枝 杆菌 的 存在 , 但 个 体 的 遗传 易 感性 .营养 状况 .情绪 状况 .居住 环境 状况 
结核 的 发 生 过 程 。 

例如 : 一 个 多 致 病因 素 致 冠 心病 的 多 病因 交互 效应 研究 , 以 单 








的 收缩 压 水 平 为 基础 ,分 
别 与 血清 胆固醇 /高 密度 脂 蛋 和 白 浓度 比 .糖尿 病史 、 吸 烟 以 及 左 心室 肥厚 (心电图 ) 等 多 种 危险 
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因素 联合 研究 , 观测 5 年 以 上 , 以 研究 这 些 因素 对 55 岁 男性 发 生 冠 心病 的 结果 (发 病 率 )( 图 
8-1), 可 见 凡 具 5 项 危险 因素 者 发 生 冠 心病 的 危险 性 为 正常 者 的 21.5 倍 , 具 2 种 危险 因素 者 也 
达 6~10 倍 。 因 此 , 在 病因 学 研究 中 , 了 解 多 病因 及 其 交互 效应 是 非常 重要 的 。 












_ 


外 
S 
I 


by 
[=] 
i 


>5 年 发 生 CHD 绝 对 危险 度 (%) 


5 
I 





0 
收缩 压 (mmHg) 120 195 120 120 10 120 195 
总 胆固醇 :HDL 185/60 185/60 250/35 185/60 185/60 185/60 250/35 
糖尿 病 否 是 否 否 


吸烟 否 否 否 否 是 否 是 
ECG/ 左 室 肥厚 ” 否 否 否 否 否 是 是 
( 引 自 cireculation:1991;83:357-363 ) 


图 8-1 冠 心病 的 多 病因 交互 效应 图 


3. 概率 论 因果 观 ” 人 类 对 因果 关系 的 认识 一 直 处 于 发 展 之 中 。 从 古 希 腊 学 者 亚 里 士 多 德 
(Aristotle ) 提 出 四 原因 说 ,到 近代 培根 (Bacon) 和 休 议 (Hume) 提 出 决定 论 的 因果 观 和 经 验 论 的 
因果 观 , 走 过 了 一 个 漫长 的 路 程 。 然 而 , 上述 的 因果 论 缘 不 能 完美 地 解释 生命 现象 中 的 因果 关 
系 。 现 代 科 学 产生 了 概率 论 的 因果 观 或 称 广义 因果 律 (law of causation )。 概 率 论 的 因果 观 认 为 
原因 就 是 使 结果 发 生 概 率 升 高 的 事件 或 特征 , 即 一 定 的 原因 可 能 导致 一 定 的 结果 。 该 观点 为 解 
释 生命 科学 中 的 因果 关系 商定 了 理论 基础 。 

Lilifield 从 概率 论 的 因果 观 层面 阐述 了 流行 病 学 的 病因 概念 , 他 在 其 所 著 的 《流行 病 学 基础 》 
一 书 中 给 出 的 病因 定义 是 : “那些 能 使 人 群 中 发 病 概率 升 高 的 因素 就 可 以 被 认为 是 病因 , 当 其 中 
的 一 个 或 多 个 因子 不 存在 时 ， 人 和 群 中 疾病 频率 就 会 下 降 ”。 MacMahon 也 认为 ， 流行 病 学 的 实际 
目的 是 发 现 能 够 预防 疾病 的 联系 , 从 这 个 目的 出 发 ,因果 关联 可 以 实用 地 定义 为 : 事件 或 特征 
之 间 的 一 种 关联 , 改变 某 一 类 别 (X ) 的 频率 或 特性 , 就 会 引起 另 一 类 别 (Y ) 的 频率 或 特性 的 改 
变 , 这 样 X 就 是 Y 的 原因 。 因 此 , 流行 病 学 的 病因 观 是 符合 概率 论 因果 观 的 , 流行 病 学 层面 的 
病因 一 般 称 之 为 危险 因素 (risk factor), 这 无 疑 体现 了 多 病因 论 的 思想 . 冲破 了 单 病因 论 的 束缚 
概率 论 因果 观 的 病因 学 定义 不 仅 具 有 病因 理论 上 的 科学 性 和 合理 性 , 而 且 具 有 重要 的 公共 卫生 

例如 : 在 20 世纪 60 年 代 美国 心 脑 血管 病人 的 死亡 率 居 高 不 下 , 经 研究 发 现 高 血压 为 其 主 
要 危险 因素 , 于 是 在 全 国 开展 了 大 规模 高 血压 防治 研究 和 人 群 防治 运动 。 约 10 年 后 , 高 血压 控 
制 率 大 大 提高 , 脑 血管 病死 亡 率 大 大 降低 , 但 冠 心病 死亡 率 下 降 不 显著 , 于 是 又 在 全 国 开展 了 
调节 高 脂 血 症 的 教育 与 防治 , 现在 全 民 高 脂 血 症 有 显著 控制 , 心血 管 疾病 死亡 率 旦 现 明显 下 降 
趋势 , 这 些 病 因 / 危 险 因 素 研究 符合 概率 论 的 因果 观 。 

(二 ) 病因 模型 

病因 模型 以 简洁 的 概念 关系 图 表达 因果 关系 , 这 种 在 已 有 理论 和 经 验 基础 上 构建 的 概念 关 
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系 图 , 为 我 们 提供 了 因果 关系 的 思维 框架 。 由 于 对 因果 关系 有 不 同 的 理解 或 不 同 的 侧重 , 所 以 
研究 者 构建 了 多 种 类 型 的 病因 模型 。 目 前 具有 代表 性 的 危险 因素 作用 模式 有 3 类 , 即 生态 学 模 
型 (流行 病 学 三 角 模式 与 轮 状 模式 )、 疾 病因 素 模 型 和 病因 和 链 与 病因 网 络 模型 。 

1. 生态 学 模型 ”该 类 模型 将 机 体 与 环境 作为 一 个 整体 来 考虑 。 常 见 的 有 流行 病 学 三 角 模 
型 (又 称病 因 - 宿主 - 环境 模型 ) 以 及 轮 状 模型 , 该 类 模型 给 出 了 寻找 病因 的 分 类 大 框架 , 模型 简 
明 ,整体 性 强 。 

(1) 流行 病 学 三 角 模 型 (epidemiologic triangle ): 流行 病 学 三 角 模 型 理论 用 病因 、 宿 主 和 环境 
三 者 的 平衡 紊乱 来 解释 在 健康 变化 和 疾病 中 三 者 的 作用 。 若 三 者 处 于 平衡 状态 , 表现 为 健康 ; 
病因 作用 增强 则 引起 疾病 。 例 如 : 甲 型 流感 病毒 变异 , 发 生 流感 流行 ; 又 如 沙 利 度 胺 (反应 停 ) 
投放 市 场 , 短 肢 畴 形 儿 增加 。 当 宿主 的 易 感 性 增强 (或 抵抗 力 下 降 ) 时 , 同样 可 以 导致 疾病 的 发 
生 。 例 如 : 交通 不 便 的 农村 相隔 多 年 后 发 生 麻疹 流行 ， 老年 人 骨 质 变 脆 容易 发 生 骨 折 。 如 果 环 
境 变化 则 可 加 重病 因 的 作用 。 例 如 夏季 多 蚊 , 乙 型 脑 炎 流行 ; 松花 江 污染 , 发 生 甲 基 冬 中 毒 。 
环境 变化 还 可 促使 抵抗 力 下 降 , 例如 战争 时 期 的 营养 不 良 、 结 核 病 多 发 ; 或 环境 变化 , 因 不 适应 
环境 的 变化 而 发 生 疾病 (筑波 病 )。 

在 病因 学 研究 中 , 尤其 是 传染 病 病因 学 研究 中 , 多 年 来 , 流行 病 学 三 角 模型 得 到 了 广泛 的 
认同 。 该 模型 (图 8-2) 认 为 疾病 的 发 生 必须 有 病原 物 、 机 体 ( 宿 主 ) 及 环境 三 个 要 素 的 协同 作 
用 , 任何 一 个 因素 的 改变 都 会 增加 或 降低 疾病 发 生 的 频率 。 在 工业 革命 以 前 疾病 谱 呈 现 以 传染 
病 为 主 的 特征 , 医学 研究 关注 的 焦点 集中 在 病原 微生物 , 因此 , 三 角 模型 特别 强调 病原 体 的 作 
用 ,将 其 从 环境 因素 中 分 离 出 来 ,单列 为 流行 病 学 三 角 中 的 一 个 重要 部 分 。 但 是 , 随 着 社会 的 
进步 和 科学 的 发 展 , 即使 对 于 传染 性 疾病 , 流行 病 学 专家 也 更 倾向 于 将 病原 微生物 纳入 到 环境 
因素 中 , 从 而 可 以 更 全 面 地 反映 各 因素 之 间 的 相互 作用 。 更 何况 疾病 谱 已 发 生 了 很 大 变化 ,在 
以 慢性 非 传染 性 疾病 为 主 的 今天 , 疾病 的 发 生 可 能 与 社会 经 济 、 精神 心理 等 多 种 因素 有 关 , 这 
些 因素 间 的 相互 关系 远 非 三 角 模 型 所 能 涵盖 。 

(2 ) 轮 状 模型 (wheel model): 1973 年 , Susser 提出 了 疾病 病因 的 轮 状 模型 用 以 表示 机 体 ( 宿 
主 ) 与 环境 的 关系 , 相对 于 流行 病 学 三 角 模型 , 疾病 病因 的 轮 状 模型 更 强调 环境 及 其 与 机 体 间 的 
密切 关系 。 轮 状 模型 ( 见 彩 图 8-3 ) 以 宿主 为 轮轴 ， 模型 由 外 环 和 内 环 两 部 分 组 成 , 外 环 指 的 是 
环境 , 包括 生物 、 理 化 和 社会 环境 ; 内 环 指 的 是 机 体 , 包括 人 的 自 
然 特 征 (如 年 龄 .性 别 ) 营养 状 况 .免疫 力 、 内 分 泌 水 平和 遗传 等 ， 
其 核心 是 遗传 基因 。 外 环 生物 环境 包括 病毒 .细菌 等 各 种 病原 微 
生物 以 及 传播 媒介 和 作为 食物 、 制 药 原料 的 动 植物 ; 理化 环境 指 
的 是 气候 水、 大气 、 土 壤 、 光 、 辐 射 和 各 种 化 学 物质 如 农药 、 杀 虫 病因 
剂 和 职业 污染 物 等 ; 社会 环境 包括 社会 经 济 水 平 ,文化 水 平 、 政治 
制度 .职业 、 居 住 条 件 .精神 因素 .个 人 行为 方式 等 。 轮 状 模型 各 
部 分 的 相对 大 小 随 不 同 疾病 而 有 所 变化 。 

2. 疾病 因素 模型 ”该 模型 (图 8-4) 在 病因 分 类 上 具有 较 强 的 可 操作 性 和 较 强 的 实践 指导 
意义 。 该 模型 将 病因 因素 分 为 两 个 层次 : 外 围 的 远 因 和 致 病 机 制 的 近 因 。 外 围 的 远 因 包 括 社会 
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经 济 、 生 物 学 、 环 境 、 心 理 \ 行 为 和 卫生 保健 因素 。 基 础 或 临床 医学 的 病因 主要 是 指 致 病 机 制 的 
近 因 , 临床 流行 病 学 病因 学 研究 系 以 临床 为 基础 ,具有 近 因 与 远 因 相 结合 的 特色 。 

3. 病因 链 与 病因 网 络 模型 ”1970 年 , MacMahon 等 提出 了 病因 作用 的 网 络 模型 , 即 疾病 的 
病因 因素 按时 间 顺 序 连 接 起 来 构成 病因 链 (chain of causation ), 多 个 病因 链 交错 联接 构成 病因 网 
(web of causation ), 它 提供 了 因果 关系 的 完整 路 径 。MacMahon 等 指出 , 任何 结果 都 不 是 由 单一 
的 孤立 原因 所 致 , 而 是 各 种 因素 互相 交错 , 各 种 因素 又 各 有 其 前 因 后 果 , 其 复杂 程度 远 超过 我 
们 的 想象 限度 。 例 如 , 肝癌 的 病因 网 可 看 成 是 由 乙 型 肝炎 病毒 感染 、 饮 用 沟 塘 水 、 食 用 黄 曲霉 
毒素 污染 的 食物 、 遗 传 倾向 和 过 量 摄 入 乙醇 等 多 条 病因 链 交 错 构成 , 其 中 每 条 病因 链 又 由 多 个 
环节 连接 构成 , 如 饮用 沟 塘 水 可 能 是 由 于 水 中 的 藻类 毒素 引起 了 肝 细 胞 恶变 。 

病因 网 络 模 型 的 优点 是 表示 直观 、 具 体 ,为 病因 阐述 提供 了 依据 ,具有 较 强 的 可 操作 性 , 但 
其 分 析 的 技术 难度 较 大 。 

(三 ) 病因 与 危险 因素 

随 着 病因 学 研究 的 不 断 深入 , 多 病因 学 说 已 被 医学 界 所 接受 , 已 发 现 越 来 越 多 的 疾病 是 多 
因 性 的 , 而 且 存在 一 病 多 因 、 一 因 多 病 和 多 因 多 病 等 复杂 情况 。 按 照 病 因 与 疾病 间 的 作用 方式 、 
作用 程度 及 传统 哲学 的 观点 , 人 们 给 病因 以 多 种 分 类 方法 , 本 节 仅 介 绍 以 下 三 种 类 型 : 

1. 必要 病因 与 充分 病因 “按照 传统 的 哲学 观点 , 凡 效应 都 有 “必要 条 件 ” 和 “充分 条 件 ” 之 
分 , 借助 这 种 抽象 的 逻辑 思维 方式 ,我们 可 以 认为 任何 疾病 的 发 生 都 有 相应 的 必要 病因 和 充分 
病因 。 

(1) 必要 病因 (necessary cause ): 指 有 相应 疾病 发 生 以 前 , 必定 (概率 为 100% ) 有 该 因素 存在 。 
如 果 缺 乏 该 因素 即 不 会 引起 某 疾病 , 则 称 该 因素 为 该 病 的 必要 病因 。 如 没有 结核 分 枝 杆菌 感染 
就 不 会 发 生 结 核 , 因此 , 结核 分 枝 杆菌 是 结核 病 的 必要 病因 。 绝 大 多 数 传染 性 疾病 、 职 业 病 等 
都 有 一 个 比较 明确 的 必要 病因 , 而 大 多 数 慢性 非 传染 性 疾病 目前 尚未 发 现 他 们 的 必要 病因 。 由 
于 大 多 数 慢性 非 传染 性 疾病 是 多 因 性 的 , 因此, 这 类 疾病 可 能 不 存在 一 个 必要 病因 ,或 是 必要 
病因 仍 待 探究 。 

(2) 充分 病因 (sufficient cause): 是 指 车 有 该 病因 存在 ， 必定 (概率 是 100% ) 导 致 某 疾病 发 
生 。 显 然 , 充分 病因 即使 针对 传染 性 疾病 也 是 非常 少见 的 , 因此 , 对 充分 病因 的 理解 应 注意 三 
点 : 四 对 大 多 数 疾病 而 言 , 充分 病因 的 组 成 因素 不 是 一 个 ,而 是 一 组 。 如 上 述 的 结核 分 枝 杆菌 
感染 仅 是 结核 病 的 一 个 必要 病因 , 而 不 是 结核 病 的 一 -个 充分 病因 ，。 因 为 大 多 数 的 结核 分 枝 杆菌 
感染 者 可 由 于 自身 抵抗 力 的 作用 而 不 发 生 结核 病 , 只 有 结核 分 枝 杆 菌 感染 结合 机 体 特异 性 和 非 
特异 性 抵抗 力 的 降低 , 才能 构成 结核 病 的 一 个 充分 病因 。@@ 对 于 大 多 数 疾病 而 言 , 其 充分 病因 
目前 并 未 明了 , 一 般 只 证 实 或 初步 证 实 充分 病因 中 的 个 别 或 几 个 因素 。@@ 对 于 大 多 数 慢性 非 传 
染 性 疾病 来 说 , 目前 认为 其 充分 病因 不 止 一 个 , 有 的 可 能 有 多 个 充分 病因 , 各 充分 病因 的 组 成 
因素 可 能 不 同 , 因而 这 些 疾病 就 可 能 没有 必要 病因 。 如 肥胖 (超重 ) 是 高 血压 的 一 个 “病因 ”, 但 
有 的 高 血压 病人 并 不 超重 , 提示 导致 这 部 分 病人 发 病 的 充分 病因 中 可 能 不 包括 肥胖 。 

在 日 常生 活 中 人 们 发 现 开 启 开关 则 电灯 发 光 , 于 是 便 认为 电灯 开关 是 “ 因 ”, 电灯 发 光 是 “ 果 ”， 
只 要 启动 因 , 则 必然 获得 果 ( 灯 亮 )。 这 时 此 因 对 其 果 来 说 是 必要 而 且 充 分 的 原因 。 但 在 电 条 
开关 与 电灯 发 亮 的 因果 关系 中 , 实际 上 有 些 重要 因素 被 省 略 了 。 例 如 电线 、 灯泡 灯头、 电流 
等 。 这 些 环 节 的 任何 一 个 都 与 开关 同样 重要 , 任何 一 个 环节 的 缺少 都 会 影响 结果 的 产生 。 因 此 
可 以 认为 , 任何 结果 的 原因 必然 是 由 一 组 作用 谐 调 的 因素 共同 组 成 的 , 这 就 是 充分 病因 。 所 以 
“充分 病因 ”可 以 定义 为 : 一 组 必然 导致 疾病 的 最 低 限 度 的 状态 或 事件 。 这 里 的 “最 低 限 度 " 是 
指 状态 或 事件 的 任何 部 分 均 是 不 可 少 的 。 这 些 组 成 充分 病因 的 必 不 可 少 的 部 分 称 为 成 分 病因 
(component causes )。 


2. 直接 病因 与 间接 病因 基于 病因 链 和 病因 网 络 模 型 , 引起 疾病 的 诸多 因素 有 时 可 以 连续 
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按 顺 次 起 作用 , 即 病因 1 导致 病因 2, 最 终 导致 疾病 。 可 简要 表示 为 :病因 1 一 一 病因 2 一 一 疾 


病 。 这 里 , 病因 2 称 为 直接 病因 (direct causes), 病因 1 称 为 间接 病因 (indirect causes )。 直接 病 
因 是 指 只 有 该 病因 作用 于 人 体 才能 够 引起 发 病 , 对 应 于 上 述 疾病 因素 模型 中 的 近 因 。 例 如 乙 型 
肝炎 病毒 是 乙 型 肝炎 的 直接 病因 ; 结核 分 枝 杆菌 是 结核 病 的 直接 病因 。 间 接 病 因 实 际 上 反映 
了 引起 疾病 的 阶段 性 或 中 间 性 过 程 , 指 可 以 促成 和 加 速 疾病 发 生 的 某 些 因素 ， 其 存在 与 疾病 的 
发 生 呈 间接 关联 , 对 应 于 疾病 因素 模型 中 的 远 因 。 例 如 : 营养 不 良 、 居 住 条 件 差 、 机 体 免 疫 力 低 
下 、 社 会 经 济 环境 的 恶化 等 都 可 能 造成 患 病 的 易 感性 增加 , 这 些 因素 被 称 之 为 间接 病因 。 

再 以 世界 卫生 组 织 (WHO)2005 年 提出 的 主要 慢性 病 的 病因 链 为 例 ( 图 8-5), 高 血压 、 高 血 
糖 、 血 脂 异常 和 超重 /肥胖 这 些 因素 就 是 所 谓 的 直接 病因 或 称 之 为 “ 近 端 病因 ”, 是 医学 界 更 为 
关注 的 主题 。 它 们 在 病因 链 上 距离 疾病 结局 近 ， 病因 学 意义 相对 明确 ,但 是 值得 注意 的 是 越 靠 
近 疾 病 结 局 近 端 的 因素 , 涉及 的 人 群 面 越 窄 , 预防 的 机 会 越 少 。 而 从 个 体 层 面 来 看 ,不 合理 腾 
食 及 过 多 的 能 量 摄 入 、 体 力 活动 少 、 吸烟 则 是 上 述 直 接 病 因 共有 的 、 最 重要 的 、 可 以 改变 的 危险 
因素 ,有 效 干 预 这 三 种 危险 因素 可 以 预防 80% 的 心血 管 疾病 、2 型 糖尿 病 和 40% 的 肿瘤 ; 再 往 
病因 链 更 远 端 看 , 还 有 “病因 的 原因 ”, 即 根本 的 社会 经 济 、 文化 .政治 和 环境 因素 , 称 之 为 “健康 
社会 决定 因素 ”(social determinants of health, SDH )。 此 类 远 端 影响 因素 作为 间接 病因 ， 与 疾病 的 
因果 机 制 可 能 不 是 那么 明确 与 直接 ,但 涉及 的 人 群 面 广 ， 预防 机 会 大 , 通过 改善 这 些 因 素 对 于 
降低 总 疾病 负担 的 预防 效率 会 很 高 。 这 些 关于 病因 的 认识 和 探讨 势必 会 对 疾病 防治 策略 的 调 
整 产生 深远 的 影响 。 
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图 8-5 ”主要 慢性 病 病因 链 


3. 危险 因素 ”目前 , 慢性 非 传染 性 疾病 已 成 为 危害 人 类 健康 的 主要 疾病 , 慢性 疾病 由 于 发 
病 比 较 隐匿 , 病程 缓慢 , 病因 复杂 , 从 单一 的 患 病 个 体 去 研究 疾病 病因 会 十 分 困难 , 因此 , 需要 
以 相应 群体 作为 研究 对 象 对 有 关 的 发 病因 素 进 行 宏观 分 析 探讨 , 因而 提出 了 危险 因素 这 一 概 
念 。 如 前 所 述 , 一 般 将 流行 病 学 层次 的 病因 称 为 危险 因素 , 它 是 指 疾病 的 发 生 与 该 因素 有 一 定 
的 因果 关系 , 但 是 尚 无 可 靠 的 证 据 能 够 证 明 该 因素 的 致 病 效应 , 但 是 当 消除 该 因素 时 , 疾病 发 
生 的 概率 也 随 之 下 降 。 在 病因 学 研究 中 , 将 这 类 与 疾病 发 生 有 关 的 因素 即 称 为 危险 因素 。 危 险 
因素 的 概念 无 疑 体 现 了 概率 论 因果 观 。 

二 、 寻 找 病因 的 指南 清单 

临床 医师 在 进行 病因 学 研究 之 前 , 一 般 须 考 虑 选择 对 人 类 健康 威胁 较 大 、 临 床上 存在 医疗 
需要 的 疾病 、 病 因 不 明 的 疾病 进行 研究 , 才 更 具有 现实 和 科学 意义 。 上 述 病因 模型 及 病因 分 类 
为 我 们 指出 了 寻找 疾病 病因 的 大 致 方向 类别 或 联系 方式 (病因 网 ), 但 这 些 模型 相对 而 言 还 比 
较 抽 象 , 不 便于 实际 研究 工作 的 开展 , 在 病因 学 研究 实践 中 , 为 了 增加 寻找 病因 的 可 操作 性 ,我 
们 可 以 从 表 8-1 的 寻找 病因 指南 清单 中 得 到 启示 。 
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表 8-1 寻找 病因 指南 清单 


. 先天 的 “ 基 


二 宿主 因素 
.后 天 的 年 认 . 发 诊 、 宫 、 休 格 、 行 为 关 到、 获得 性 免疫 .既往 史 


二 、 环 境 因素 












展 吉 也 理 (位 置 、 地形 、 远 质 ) 

度 、 居 室 .流动 、 都 市 化 、 交 通 、 战 争 、 灾 害 )、 经 济 ( 收 
证 ( 构成、 婚姻 状况 、 家 庭 功能 和 生活 方式、 饮食 习惯 、 
< ] 动 、 消 遗 )、 教 育 文化 、 医 疗 保健 、 职 业 (种 类 、 场 
条 件 、 福利 、 劳保 设施 政治 \、 宗 教 、 风 俗 
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社会 的 


三 、 疾 病 自然 史 对 病因 学 研究 的 意义 


疾病 自然 史 是 指 在 不 给 予 任何 治疗 和 干预 措施 的 情况 下 ,疾病 从 发 生 、 发 展 到 结局 的 整个 
过 程 ,疾病 的 自然 中 可 以 分 为 生物 学 反应 期 、 亚 临床 期 (或 称 临床 前 期 , 即 症状 出 现 前 阶段 入 临 
床 期 和 疾病 相关 结局 (如 竣 僵 、 残 疾 和 死亡 ) 四 个 时 期 。 不 同 疾病 其 自然 史 差 异 很 大 , 各 期 经 历 
的 时 间 长 短 , 以 及 各 个 阶段 的 表现 也 有 很 大 的 差异 。 了 解 疾病 的 自然 史 对 病因 学 研究 有 重要 意 
义 , 主要 表现 在 以 下 两 个 方面 : 

(一 ) 排除 临床 早期 病例 作为 病因 学 的 研究 对 象 

为 保证 病因 学 研究 结果 的 真实 可 靠 , 应 避免 将 处 于 生物 学 反应 期 和 亚 临床 期 病例 纳入 研究 对 
象 (导致 错 分 为 病人 群 ” ) 而 造成 选择 性 偏 位。 这 就 要 求 在 选择 研究 对 象 时 , 需要 采用 高 敏感 度 
的 诊断 试验 , 以 发 现 处 于 生物 学 反应 期 和 亚 临 床 期 病例 , 避免 纳入 可 能 的 早期 患者 而 影响 研究 质量 。 

《二 》 确定 有 效 的 随访 期 、 防 止 产生 假 阴性 结果 

对 于 若干 慢性 病 发 病 后 的 自然 病史 , 往往 有 一 个 较 长 的 时 间 过 程 , 其 中 生物 学 反应 期 和 临 
冻 前 期 经 历 的 时 间 也 许 较 长 。 因 此 , 在 病因 学 SM 从 其 暴露 于 可 能 致 病因 素 之 后 , 到 临床 
表现 , 需要 一 个 时 间 上 的 效应 过 程 。 故 应 设计 合适 的 致 病 效应 观测 期 。 如 果 观 测 期 短 , 可 能 有 
jj 处 于 生物 学 反应 期 或 临床 前 期 而 未 能 被 确诊 . 于 是 就 出 现 了 “ 假 阴 性 " 结果 而 被 漏诊 , 这 
2 响 人 研究 结果 的 真实 性 。 从 疾病 自然 史 角度 出 发 , 确定 合理 的 随访 期 ,并 采用 特异 度 和 第 
感度 高 的 诊断 试验 方法 , 以 助 早期 或 不 典型 病例 的 确诊 。 这 些 在 病因 学 研究 中 应 有 充分 的 认识 。 
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病因 与 危险 因素 作为 重要 的 医学 问题 之 一 , 可 以 根据 对 疾病 的 认识 和 掌握 资料 的 程度 分 阶 
段 进行 研究 。 基 本 过 程 和 可 能 采用 的 方法 见 图 8-6。 





过 











上 一 一 -形成 病因 假设 一 一 一 >|< 一 假设 检验 一 =| 一 病因 推断 一 =| 











8-6 ”病因 与 危险 因素 研究 的 基本 过 程 
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一 、 提 出 病因 假设 
(一 ) 假设 的 作用 和 特点 
在 病因 探索 研究 中 , 形成 病因 假设 , 是 关键 的 一 步 。 假 设 是 科学 研究 中 一 种 广泛 应 用 的 方 
法 , 它 是 认 据 已 知 的 科学 原理 各 科学 事实 , 对 未 知 的 自然 现象 及 其 规律 性 所 纵 出 的 假定 性 说 明 
或 推测 性 解释 。 
在 临床 医疗 实践 或 人 群 流行 病 学 研究 中 , 当 发 生 了 某 种 疾病 , 根据 其 基本 背景 知识 ,临床 和 












不明, 会 为 正确 的 诊断 和 有 效 防治 带 来 很 大 的 困难 , 这 就 追 





须 对 这 种 疾病 的 发 病原 因 进 行 研 究 。 例 如 : 我 国 2003 年 春季 在 广州 始 发 的 SARS， 
行 ，; ,病死 率 高 , 病因 不 明 。 对 人 群 健康 的 威胁 与 危害 十 分 严重 , 迫切 需要 弄 清 SARS 


的 病因 。 

对 于 不 明 病 因 疾 病 进 行 病因 学 研究 , 首先 必须 面 对 被 研究 的 疾病 , 依据 它 在 人 群 中 的 分 布 
特点 .临床 表现 、 病 理 损害 的 定位 及 其 损害 的 程度 , 现 有 水 平 的 各 种 化 验 、 检 查 结果 、 综 合 分 析 ， 
作出 一 系列 的 排除 诊断 ,检索 相关 文献 , 在 进行 系统 综合 分 析 的 基础 上 , 作出 可 能 的 “假设 诊 
断 , 这 就 是 要 提出 的 病因 假设 。 

例如 : SARS 的 暴发 流行 是 通过 呼吸 道 传染 的 。 病 因 方 面 排除 了 细菌 性 感染 .常见 呼吸 道 病 
毒 以 及 流感 病毒 感染 。 有 人 研究 认为 衣原体 致 病 , 其 后 被 否定 , 于 是 提出 了 可 能 为 一 种 毒 力 很 
强 的 未 知 病毒 所 致 病因 假设 , 通过 国际 协作 研究 , 终于 证 实 了 SARS 的 病原 体 (病因 ) 系 变异 型 








又 如 ,我 国 华北 地 区 大 面积 调查 食管 癌 的 流行 特征 后 , 通过 资料 分 析 与 概括 , 发 现 该 地 食 
7 :高 的 县 ,市 , 均 集 中 存 太行 山脉 南 段 三 省 (河北 河南、 山西) 交界 处 ,并 由 此 处 向 
四 周 汲 渐 减 低 , 与 地 势 高 低 存在 明显 相关 关系 ; 而 且 发 病 率 大 体 呈 不 规则 的 同心 图 分 布 , 最 高 
和 最 低 相 究 者 考虑 到 地 理 环境 的 可 能 重要 作用 , 有 人 提出 食管 癌 的 水 土 病因 学 
i 有 人 根据 这 个 假设 ,开展 了 地 质 化 学 方面 的 研究 。 
(二 ) 形成 病因 假设 的 逻辑 方法 
前 已 提 及 事实 依据 和 理论 基础 是 建立 假设 的 两 个 支撑 点 , 但 是 , 假设 的 形成 不 等 于 就 事 论 
事 或 事实 与 已 有 理论 的 混 台 。 由 事实 和 已 有 理论 形成 假设 , 必须 经 过 一 个 较 严 密 的 迎 辑 思维 过 
程 。 换 名 话说 , 假设 形成 的 常用 方法 是 逻辑 方法 。 而 假设 形成 过 程 中 常用 的 钠 辑 方法 主要 是 归 
纳 演绎 法 。 这 种 方法 对 于 病因 研究 的 因果 仿 设 有 重要 理论 和 实际 指导 价值 . 
1. 归纳 法 (Mi 准则 ) 了 Ss. Mil 是 19 世纪 的 哲学 家 , 1856 年 在 他 所 著 的 《 迎 辑 系统 》 一 书 
中 建立 了 数 条 准则 , 其 中 科学 实验 四 法 常 被 用 于 分 析 流行 病 学 研究 中 形成 假设 ,设计 研究 方案 
和 进行 病因 推断 。 后 人 在 科学 实验 四 法 的 基础 上 将 同 异 并 用 法 单列 , 也 即 科学 实验 五 法 。 
(1) 求 同 法 (method of agreement ): 又 称 一 致 法 或 契合 法 或 “ 异 中 求 同 法 ”, 指 对 不 同 的 事件 
或 事物 找 出 它们 的 共同 点 一 共性 。 如 在 肝癌 的 病例 对 照 研究 中 , 肝癌 病例 组 发 现 都 有 或 相 
当 部 分 有 乙肝 病毒 感染 标记 ; 队列 研究 中 ,有 乙 型 肝炎 病毒 持续 感染 者 其 肝癌 发 病 紊 较 高 。 提 
示 乙 肝病 毒 感染 可 能 是 肝 浪 的 危险 因素 之 一 。 食 物 中 毒 事件 中 . 中 毒 患者 大 多 有 进食 相同 食物 
史 , 则 可 以 提示 由 该 食物 引起 中 毒 。 
(2) 求 异 法 (method of difference ): 又 称 差 异 法 或 “ 同 中 求 异 法 ”， 指 在 相似 的 事件 或 事物 之 
间 找 不 同 点 (重要 的 差别 )。 还 是 以 肝癌 研究 为 例 , 在 病例 对 照 研究 中 ,对 照 组 多 数 不 饮 用 沟 塘 
水 ; 在 队列 研究 中 , 不 饮用 沟 塘 水 的 非 暴露 组 的 肝癌 发 病 率 低 于 饮用 沟 塘 水 的 暴露 组 的 发 病 率 。 
提示 两 组 与 肝 瘤 发生 有 关 的 差异 之 一 是 有 无 暴露 于 沟 塘 水 。 再 如 在 非 肝 瘤 病 例 中 发 现 都 没有 
或 相当 部 分 没有 乙肝 病毒 感染 标记 , 表明 乙肝 病毒 感染 是 肝癌 的 危险 因素 之 一 。 
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(3) 同 异 并 用 法 (joint method of agreement and difference ): 求 同 法 和 求 异 法 并 用 , 相当 于 间 一 
研究 中 设 有 比较 组 , 控制 干扰 因素 。 

如 富 颈 瘤 的 病因 问题 , 据 报道 : 性 生活 越 是 混乱 的 妇女 发 病 率 越 高 , 早 婚 妇女 的 发 病 率 又 
高 于 晚婚 者 . 这 是 求 同 。 与 此 相反 , 修女 尼姑 与 独身 主义 妇女 很 少 患 宫颈 癌 , 这 是 求 异 。 因 
此 ,有 人 提出 性 生活 中 的 某 因 素 可 能 与 宫颈 癌 的 发 病 有 联系 。 随 后 的 研究 表明 : 宫颈 瘤 可 能 与 
性 交 时 的 2 型 疱疹 病毒 感染 有 关 ， 同 异 并 用 法 是 比较 性 研究 (有 对 照 组 ) 设 计 的 逻辑 学 基础 。 

(4) 共 变 法 (method of concomitant variation ): 可 以 看 成 是 求 同 法 的 特例 。 指 研究 因素 的 暴露 
程度 不 同时 , 疾病 的 频率 也 发 生 相应 的 变动 , 即 在 研究 中 注意 发 现 疾病 的 患 病 率 ( 有 时 是 发 病 
率 ) 波 历时 有 哪些 因素 在 变动 。 共 变法 的 应 用 有 一 定 的 条 件 , 只 有 当 有 关 ( 暴 露 ) 因 素 不 是 定性 
的 ,而 是 等 级 或 定量 的 ,并 与 事件 (疾病 ) 效 应 呈 量 变 关 系 时 , 才 可 以 应 用 共 变 法 。 

如 在 吸烟 与 肺癌 的 研究 中 , 随 着 吸烟 剂量 ( 等级) 的 增加 , 肺癌 的 优势 比 (OR ) 或 相对 危险 度 
(RR) 也 增加 , 即 呈 共 变 或 剂量 -反应 关系 , 故 支 持 吸 烟 是 肺癌 的 病因 的 假设 。 

(5) 剩余 法 (method of residues ): 剩余 法 可 以 看 成 是 求 异 法 的 特例 , 指 当 人 们 已 知 某 复 合 结 
局 事件 (A、B 、C ) 的 有 关 暴 露 因素 在 特定 的 范围 (ab、c), 通过 事先 的 归纳 又 知道 b 说 明 B,e 说 
明 C ,那么 剩余 的 a 必定 说 明 A。 剩 余 法 就 像 算术 中 的 减法 , 即 在 一 组 复杂 的 现象 中 把 已 知 联 系 
的 现象 去 掉 ,探寻 其 他 (剩余 ) 现 象 的 联系 。 如 在 肝癌 的 病因 研究 中 , 肝癌 的 发 病 率 除了 乙肝 病 
毒 感染 和 黄 曲 霉 毒素 能 解释 的 部 分 , 还 有 未 能 解释 的 部 分 , 这 部 分 或 可 归 因 于 暴露 因素 范围 内 
“剩余 "的 因素 , 如 饮水 中 的 藻类 毒素 。 

需要 注意 的 是 : 如 果 病 因 假设 清单 中 没有 包括 真实 的 病因 , Mill 准则 就 不 能 提供 任何 帮助 。 
遗憾 的 是 , Mill 准则 对 列 出 病因 假设 清单 并 不 能 提供 指导 ,我们 也 无 法 知道 要 寻找 的 “那个 " 因 
素 是 否 在 清单 中 。 

2. 假设 演绎 法 ”演绎 是 从 一 般 到 个 别 的 推理 。 它 是 根据 已 知 的 规律 来 推论 未 知事 物 的 方 
法 , 故 又 称 类 推 法 。 假 设 形成 后 ,通过 假设 演绎 法 同 检验 假设 的 分 析 性 研究 相 衔 接 。 

例如 ,我 国 原 发 性 肝癌 高 发 区 主要 分 布 在 温暖 .潮湿 的 东南 沿海 地 区 , 在 这 些 地 区 进行 的 
大 量 描述 性 研究 所 获 结果 提示 , 乙 型 肝炎 病毒 感染 、 饮 用 沟 塘 水 、 食 用 被 黄 曲 霉 毒素 污染 的 食 
物 等 因素 的 分 布 与 原 发 性 肝癌 的 分 布 相 一 致 , 从 而 为 其 后 的 分 析 和 实验 流行 病 学 研究 提供 了 线 
索 ,并 形成 了 相应 的 工作 假设 。 这 一 形成 假设 的 过 程 衔接 了 描述 性 研究 和 分 析 性 研究 , 其 原理 
本 质 上 是 假设 演绎 法 (hypothesis-deduction method )。 其 整个 推论 过 程 为 : 从 假设 演绎 推出 具体 
的 证 据 , 然后 用 观察 或 实验 验证 这 个 证 据 。 如 果 证 据 成 立 , 则 支持 假设 的 成 立 。 从 逻辑 上 看 ， 
反 推 是 归纳 的 。 从 一 个 假设 可 推出 多 个 具体 证 据 , 检验 证 实 的 具体 证 据 越 多 , 或 证 据 的 条 件 越 
多 种 多 样 , 则 归纳 支持 这 个 假设 的 概率 越 大 。 如 果 由 假设 演绎 出 来 的 具体 证 据 不 成 立 , 并 不 能 
简单 地 否定 假设 , 还 需要 考虑 其 他 影响 因素 的 存在 。 

以 上 的 所 谓 归纳 法 以 及 假设 演绎 法 , 在 病因 学 的 假设 中 , 可 联系 具体 实际 参考 应 用 。 

二 、 验 证 病因 假设 的 要 素 

如 上 所 述 , 科学 的 假设 是 在 一 定 的 经 验 材 料 和 科学 理论 基础 上 经 过 逻辑 思维 加 工 提出 来 
的 , 因此 , 同一 个 论题 , 由 于 事实 依据 不 同 , 对 科学 理论 的 理解 不 同 , 思维 方式 不 同等 , 常常 会 出 
现 不 同 的 假设 。 不 仅 不 同 的 科研 工作 者 对 某 一 论题 会 提出 不 同 的 假设 , 甚至 同一 学 者 对 同一 论 
题 ,在 不 同时 期 提出 的 假设 也 会 有 差别 甚至 是 很 大 的 差别 , 这 在 医学 对 未 知 病因 的 研究 , 如 像 
肿瘤 、 心 脑 血 管 病 等 病因 多 元 性 就 是 如 此 , 由 此 来 看 , 在 科学 上 出 现 不 同 的 假设 , 促进 对 一 个 问 
题 的 全 面 认识 是 很 重要 的 一 种 正常 的 现象 , 也 是 科学 发 展 兴旺 发 达 的 重要 标志 。 

当然 , 科学 上 各 种 不 同 的 假设 有 时 受 着 主客 观 认识 水 平 的 限制 , 总 有 正确 和 错误 之 分 , 也 
有 完善 与 不 完善 之 别 。 但 是 假设 的 提出 应 持 科学 求实 、 严 并 、 创 新 的 态度 , 力争 使 自己 对 所 研 
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完 同 题 假设 ,建立 在 较为 可 靠 的 科学 理性 基础 之 上 , 只 有 这 样 才 有 利于 科学 的 发 展 : 
(一 ) 福 验 证 实 需要 进步 深化 a 

假设 是 否 正 确 , 需要 通过 实践 (调查 、 观 察 和 实验 ) 来 检验 。 检 验 药 结果 无 韭 是 证 实 或 证 
急 。 如 果 要 证 实 自己 研究 的 假设 (如 未 知 病因 ), 那 就 应 该 全 面 进行 研究 , 以 探索 在 哪些 条 件 下 
是 符合 的 .在 哪些 条 件 下 是 不 符合 的 , 乒 出 它 的 适用 范围 和 局 限 性 , 并 且 深入 地 ; 
性 具 在 联系 , 找 出 它 的 规律 与 机 制 , 争 取 由 假设 二 天 到 理性 认识 并 指导 自己 的 工人 和 a 
SARS 从 临床 流行 病 学 研究 深化 到 病原 学 的 确定 等 , 这 些 研究 证 实 了 “假设 "其 成 果 又 有 效 地 指 
导 了 SARS 防治 实践 。 

(二 ) 检验 证 伪 应 予 区 别 对 竺 :科学 

如 果 检验 结果 与 假设 不 符 , 甚至 完全 相反 , 这 表明 假设 是 不 够 正确 或 是 错 总 的 。 对 于 科 祁 
的 发 展 来 说 ,证实 和 证 伪 都 具有 重要 意义 。 因 为 没有 证 实 , 不 能 肯定 正确 的 假设 ; 没有 证 伪 ， 
不 能 否定 错误 的 假设 。 因 此 ,对 于 任何 假设 的 验证 结果 , 应 持 科学 态度 , 进行 具体 分 析 a 
待 。 一 般 面 言 , 凡 实验 结果 或 观察 到 的 现象 与 假设 蕉 然 相反 ,或 面 对 检 验 结果 即使 补充 假设 也 
无 法 自圆其说 时 , 则 应 当 放弃 原 有 假设 。 若 虽 屡 遭 失败 ， ei ee 
或 虽 难 以 证 实 , 但 无 直接 否定 假设 的 证 据 时 , 则 不 应 随便 放弃 原 假设 , 仍 应 从 不 同 的 角度 或 
面 , 对 其 进行 检验 。 

(三 ) 检验 假设 的 注意 享 项 
总 的 是 主观 1 
认为 真理 ; 二 为 受 有 关 仿 倚 、 混 元 
误 芍 因 困 联系 。 在 病因 学 研 3 

























一 大 bh 性》 一 -为 通宝 验证 ， 被 确 

Ee 究 的 假设 无 非 有 三 种 情况 , 一 -为 通过 验 i | A 

Oe ; 三 为 非 科学 的 行为 导致 错 

的 出 现 . 这 是 要 

[= 求 是 的 ” := 态度。 类 

和 坚持 的 ,也 是 每 位 医学 工作 者 务必 养 成 尊重 事实 的 思想 作风 与 实 于 ee es 

学 家 蔡 悄 黎 (Thomas Huxley) 敬 经 说 过 : “我 要 做 的 是 让 我 的 愿望 符 人 四 es 下 

下 你 们 要 像 一 个 小 学 生 那 样 坐 在 事实 面前 , 淮 备 放 这 一切 先 人 之 上 本 

走 , 否则 , 就 将 一 无 所 得 ”只 有 与 事实 相符 的 假设 , 才 有 可 能 发 展 
成 为 理论 , 进而 促进 科学 的 发 展 。 





















三 、 验 证 病因 /危险 因素 假设 的 主要 研究 方法 
| 峰 订 三 济 行 病 些 的 角度 ,总 
对 于 病因 /危险 因素 尚 不 清楚 的 疾病 , 如 上 所 述 , 从 背景 知识 或 临床 或 流行 病 ee 4 
归 会 发 现 病因 线索 并 提出 病因 的 假设 (假说 ), 也 许 这 种 假设 可 能 占有 一 些 有 说 服 力 的 证 据 , 但 


太空 只 性 的 倒 突 方 可 获得 病因 学 
都 不 能 肯定 或 否定 真正 的 病因 , 因此 , 必须 通过 科学 的 分 析 性 或 实验 性 的 研究 方 可 获得 病 民 
的 真实 结论 。 





例如 : 原 发 性 肝癌 患者 , 从 临床 病例 分 析 , 多 有 乙 型 肝炎 病毒 感染 一 一 慢性 肝炎 的 短 ea 
其 相应 的 临床 特征 和 化 验 的 证 据 。 因 而 ,临床 医生 从 总 结 分 析 临 床 资 料 的 角度 , 提出 了 和 全 
病因 可 能 与 乙 型 肝炎 病毒 感染 .得 性 肝炎 病变 有 关 。 这 个 假说 不 经 过 科学 的 验证 能 肯定 或 否 
定 吗 ? 














又 如 :SARS 
病死 率 高 , 显 属 
病毒 及 常见 呼吸 
设 ( 诊 断 ), 同样 如 不 经 过 病原 (病因 ) 学 的 研究 能 肯定 或 否定 这 一 假设 吗 ? 

因此 ,病因 学 研究 往往 需要 多 学 科 和 多 专业 的 协作 和 参与 ,才能 获得 病因 学 研究 (病因 假设 
的 验证 ) 的 真正 成 5 Re 

A 学 研究 的 角度 , 临床 流行 病 学 兼 纳 了 临床 医学 和 流行 病 学 的 酚 大 学 科 优势 , 经 过 科 
学 评价 , 列 出 以 下 常用 研究 方案 及 其 证 据 的 论证 强度 (科学 性 ( 表 8-2), 供 全 究 者 应 用 时 参考 。 







己 、 


,临床 发 现 一 些 病例 病情 危急 , 肺 部 炎 变 严重 伴 急性 呼吸 功能 豪 疯 ， 
室 检验 , 排除 了 细菌 性 流感 
不 病毒 感染 的 假 
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表 8-2 不 同 病 因 研究 设计 类 型 的 论证 强度 





研究 设计 类 型 性 质 可 行 性 论证 强度 
随机 对 照 试验 前 脆性 差 于 FF 
队列 研究 前 脆性 较 好 + 
病例 对 照 研究 回顾 性 好 2 
横断 面 研究 断面 好 十 
前 瞻 / 回 顾 好 土 


叙述 性 研究 一 -一 

(一 ) 病例 对 照 研究 
病例 对 照 研究 是 分 析 流 行 病 学 中 最 基本 的 研究 类 型 之 一 性质 上 属 回顾 性 研究 。 它 是 以 确 
诊 的 患 有 某 病 的 病人 作为 病例 组 ， 选择 具有 可 比 性 的 不 患 有 该 病 的 人 群 作为 对 照 组 。 为 排除 混 
杂 因素 干扰 , 可 以 采用 配 比 设计 模式 ， 比如 用 年 龄 与 性 别 作为 配 比 因素 来 排除 年 龄 与 性 别 可 能 
的 混杂 作用 , 选择 不 患 研究 靶 病 的 人 ,以 1:1 或 1:2 比例 选择 符合 标准 的 对 象 作为 对 照 组 (参见 


本 教材 设计 方案 章节 ), 然后 进行 病例 组 与 对 照 组 的 比较 分 析 ， 借助 相应 的 统计 学 指标 , 探讨 因 
果 效 应 。 


例如 : HBsAg 与 肝癌 相关 性 的 非 配 比 设计 的 病例 对 照 研究 ， 结果 见 表 8-3。 
表 8-3 ”HBsAg 与 肝癌 关系 的 病例 对 照 研究 














病例 组 (肝癌 ) 对 照 组 ( 非 肝 癌 ) 合计 

HBsAg 阳性 35 8 43 
HBsAg 阴性 15 42 5s7 
合计 50 50 100 





OR=(35 x42)/(15x8)=14, 结 果 显示 HBsAg 与 肝癌 发 生 有 联系 。 
由 于 病例 对 照 研究 是 从 “ 果 ” 到 “ 因 ” 的 研究 过 程 ， 且 存 在 未 知 的 混杂 因素 , 论证 效率 相对 
较 低 。 


(二 ) 队列 研究 
队列 研究 是 重要 的 、 可 行 性 良好 的 病因 /危险 因素 的 研究 方法 ， 可 以 直接 观察 暴露 于 危险 


因素 的 不 同人 群 的 结局 , 具有 较 强 论证 力度 。 其 是 在 特定 人 群 中 按照 目 前 或 过 去 是 否 暴 露 于 待 
研究 的 危险 因素 , 分 为 暴露 与 非 暴露 组 ， 随访 观察 一 段 时 间 后 , 进而 比较 待 研究 疾病 的 发 病 率 。 
1 于 为 前 颇 性 研究 ， 因此 确定 暴露 与 疾病 的 因果 关系 具有 较 强 的 论证 力度 。 

例如 : 有 一 前 上 性 队列 研究 ， 观测 高 胆固醇 血 症 致 冠 心病 的 危险 性 ， 两 个 队列 各 为 1000 例 
35 岁 以 上 的 观测 对 象 , 追踪 5 年 , 追踪 率 90% 以 上 ， 结果 高 胆固醇 血 症 队列 发 现 冠 心病 83 例 ; 
而 正常 血清 胆固醇 队列 发 现 冠 心病 23 例 ( 表 8-4)。 

















表 8-4 ”高 胆固醇 血 症 致 冠 心病 因果 效应 表 














冠 心病 
A 3 合计 发 病 率 (% ) 
高 胆固醇 队列 83(a) 867(b) 950(a+b) 8.7 
: 常 胆固醇 队列 23(c) 917(d) 940(c+q) 25 
合计 106(a+c) 1784(b+d) 1890(N) 
a 
相对 危险 = 
入 险 度 (RR)= 一 =3.50(95% Cl: 3.48~3.52) 





(c+d) 
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归 因 危险 度 (4R)= 8.79% 一 2.5%=6.2% 


RR~1 


病因 学 分 数 (EF)= 00 


1 sy 
NNH= R15( 表 示 高 胆固醇 血 症 5 年 中 每 16 人 就 发 生 一 例 冠 心病 )。 
结论 : 高 


高 胆固醇 血 症 系 冠 心病 发 病 的 危险 因素 ， 其 RR=3.5(95% C1: 3.48~3.52 )。 临 
其 中 归 因 危 险 度 (attributable risk, AR) 也 称 特异 危险 度 , 又 称 率 差 (rate difference, RD)。 临 
床 试验 中 常 把 4R 叫做 绝对 危险 降低 率 (absolute risk reduction , ARR), NNH( number needed to 
hanm, 可 译 为 “ 害 - 需 暴露 人 数 " ), 具体 概念 详 见 本 教材 相关 章节 。 

(三 ) 实验 流行 病 学 研究 


比较 给 予 不 同 干 预 因素 后 实验 组 与 对 照 组 的 结局 , 借以 判断 干预 因素 对 结局 的 影响 ， ee 
因 学 的 结论 。 这 种 实验 性 研究 设计 方案 , 视 具体 情况 ,可 采用 随机 对 照 试验 ( RET); i 
随机 化 的 准 实验 研究 设计 模式 。 例 如 : 我 国 大 部 分 地 区 对 新 生 儿 和 适龄 儿童 ， 六 隘 丁 接 丰 肝炎 
病毒 性 肝炎 疫苗 以 预防 乙 型 病毒 性 肝炎 的 措施 , 通过 RCT 或 准 实验 研究 , 追踪 ne 关 
的 发 病 率 , 进而 观测 若干 年 , 如 肝癌 发 病 率 呈 相应 的 下 降 , 则 可 反 证 HBsAg 与 肝癌 的 病因 
系 。 实 验 流行 病 学 的 因果 论证 的 强度 较 强 。 
(四 ) 实验 病因 学 研究 i 
实验 病因 学 从 微观 的 角度 去 检验 病因 , 借助 生化 实验 .分 子 生物 学 实验 、 ” rie 
物 实验 等 基础 医学 的 研究 , 曾 述 病因 的 作用 机 制 ， 为 验证 病因 假设 提供 生物 学 证 据 。 tt 
站 伐 观 研究 对 于 认识 疾病 的 本 质 以 及 对 于 疾病 的 进一步 有 效 诊治 具有 重要 价值 。 安 病 se 
人 研究 成 功能 进一步 肯定 病因 假设 ,加 深 对 病因 和 致 病 过 程 的 理解 。 ee 
础 医学 中 模拟 的 人 体内 环境 或 者 是 动物 实验 均 不 可 能 代替 人 体 本 身 , 因此 ,实验 结果 外 
这 个 过 程 需要 谨慎 。 





























四 、 病 因 学 因果 关联 的 统计 学 指标 


用 于 病因 学 因果 相关 性 分 析 的 指标 常用 者 如 下 : 
曙 百 分 
1 发 病 率 (ineidence) 即 暴露 有 关 可 疑 病 因 或 危险 因素 后 , 发 病人 数 占 其 总 体 人 数 的 
比 等 。 
称 率 差 r ifference， 
2. 归 因 危险 度 ( attributable risk, 4R 或 绝对 危险 度 absolute risk, AR A | 的 攻 
AD ) 即 暴露 可 疑 病因 组 人 群 和 非 暴露 可 疑 病因 组 的 人 群 , 他 们 各 SR E 
值 。 如 A 组 发 病 率 25%、B 组 为 8%, 则 其 归 因 危险 度 为 25% 一 8%= A ed A 
3. 相对 危险 度 (relative risk, RR) 即 可 疑 病因 接触 组 的 发 病 率 与 对 照 组 的 发 病 率 之 比 ,党 
用 来 表示 暴露 与 疾病 联系 的 强度 及 其 在 病因 学 上 的 意义 大 小 。 RS ) 是 指 
4. 相对 危险 增高 度 (relative risk inerease, RRI) 或 称病 因 学 分 数 ( etiologic Duh i 因素 暴 
其 喜人 群 中 发 病 或 死亡 归 因 于 暴露 的 部 分 占 全 部 发 病 或 死亡 的 百分比 , 即 绝对 危险 度 与 因素 
露 组 发 病 率 的 比值 。 Er 
5. NNH( number needed to harm, 害 - 需 暴露 人 数 ) Re 
例 发 病 , 用 1/4R 值 表示 。NNH th 2 
良 反应 研究 中 ， 则 可 称 之 为 害 - 需 治 人 数 ,其 对 应 于 NNT(nomber needed to eat 益 - 相关 竹 的 
F 述 这 些 评价 因果 之 辣 关系 的 指标 都 可 以 计算 名 自 的 精确 度 (95% CD ie 
强度 和 价值 , 则 应 结合 具体 的 疾病 情况 和 专业 知识 来 确定 。 在 此 需要 提醒 的 是 , 在 不 同 的 
病 学 或 循 证 医学 教材 或 著作 中 各 指标 或 有 不 同 的 称谓 , 读者 应 了 注意 。 
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五 、 防 止 偏 倚 干 扰 , 慎重 分 析 病 因 效 应 的 关联 


(一 ) 虚假 关联 

在 研究 过 程 中 , 由 于 偏 倚 的 干扰 ， 会 导致 研究 结果 不 真实 ， 可 以 表现 为 夸大 或 掩盖 了 暴露 
因素 与 疾病 之 间 的 关联 强度 ， 甚至 出 现 完全 虚假 的 关联 。 例 如 ， 一 项 应 用 利 血 平治 疗 高 血压 的 
研究 。 结 果 发 现 利 血 平 治疗 有 致 乳癌 危险 的 高 度 关联 的 结论 。 于 是 人 们 就 提出 了 利 血 平 致 乳 
癌 的 “假设 ", 经 进一步 地 验证 这 一 假设 ， 发 现在 对 象 选择 方法 上 , 对 照 组 排除 了 心血 管 疾病 的 
患者 ,而 病例 组 并 未 排除 ， 产生 了 偏 倚 的 结果 ， 导致 利 血 平 与 乳腺 癌 的 虚假 联系 。 在 之 后 的 一 
项 研究 中 避免 了 选择 对 象 的 不 一 致 性 ， 结果 证 明 利 血 平 与 乳腺 癌 并 无 因果 关联 。 从 而 纠正 了 这 
一 “伪证 ”", “平反 ”了 以 上 错误 的 结论 。 

(二 ) 间接 关联 

当 排除 虚假 关联 后 ， 不 一 定 说 明 暴 露 因 素 与 疾病 肯定 存在 因果 关联 。 当 两 类 毫 不 相关 的 事 
件 , 如 两 种 疾病 都 与 某 因素 有 关联 时 ， 这 两 种 疾病 会 呈现 明显 的 统计 学 关联 ， 这 种 关联 称 为 间 
接 关联 。 为 了 避免 与 间接 因果 关联 混淆 ， 现在 称 其 为 继 发 关联 (secondary association )。 继 发 关 
联 是 由 混杂 偏 倚 引 起 的 关联 ， 即 可 疑 的 病因 (暴露 A) 与 疾病 B 并 不 存在 因果 关联 , 但 由 于 两 者 
有 共同 的 原因 C, 因此 观察 到 A 和 B 与 C 均 存 在 着 关联 。 这 也 是 在 研究 中 应 注意 要 避免 的 。 比 
如 有 调查 发 现 ， 有 伤寒 病史 者 的 痢疾 发 生 率 明显 比 无 伤寒 病史 者 高 , 提示 伤寒 病史 可 能 与 以 后 
发 生 痢疾 相关 。 这 种 相关 经 假设 检验 有 统计 学 意义 ， 可 排除 抽样 误差 的 可 能 ; 同时 经 仔细 分 析 
研究 设计 和 所 获 资 料 , 认为 偏 倚 得 到 控制 ， 可 以 排除 虚假 关联 。 但 以 现代 医学 理论 解释 ， 伤寒 
病史 与 之 后 的 痢疾 发 生 毫 无 相关 ， 但 两 者 均 受到 卫生 状况 及 个 人 卫生 习惯 的 影响 。 因 此 , 认 
为 两 者 的 关联 属于 继 发 关联 。 再 例如 ， 高 血清 胆固醇 是 冠 心 病 的 危险 因素 ， 高 血清 胆固醇 又 可 
产生 沉积 于 眼 瞪 的 黄色 瘤 ， 从 而 导致 黄色 瘤 与 冠 心 病 的 继 发 关联 。 这 是 一 种 纯粹 由 混杂 偏 倚 
产生 的 关联 , 即 怀 疑 的 病 因 黄色 瘤 与 冠 心病 并 不 存在 因果 关系 ， 而 是 由 于 两 者 均 有 共同 的 原因 
高 血清 胆固醇 ， 黄色 瘤 和 冠 心病 都 与 高 血清 胆固醇 存在 关联 ， 从 而 导致 黄色 瘙 与 冠 心病 的 继 发 
关联 。 

当 暴 露 因 素 与 疾病 D 既 存 在 直接 关联 ， 又 存在 间接 ( 继 发 ) 关 联 时 ， 暴露 与 疾病 的 直接 因果 
关联 的 程度 或 方向 将 可 能 受到 混杂 干扰 ， 即 得 到 牌 曲 的 关联 估计 值 。 例 如 , 静脉 吸毒 ( 共用 注射 
器 ) 与 性 乱 都 是 人 类 免疫 缺陷 病毒 (HIV ) 感 染 的 危险 因素 , 吸毒 者 倾向 于 发 生性 乱 行为 , 即 吸毒 
同 HIV 感染 既 存 在 直接 关联 , 又 存在 间接 关联 。 在 这 种 情况 下 , 需要 控制 性 乱 的 影响 ， 避免 性 
乱 对 吸毒 和 HIV 感染 的 直接 因果 关联 起 混杂 或 牌 曲 作用 。 

当 排 除 抽样 误差 、 虚 假 关 联 和 继 发 关联 后 , 两 事件 间 的 关联 才 可 能 是 因果 关联 ， 才能 进行 
暴露 因素 与 疾病 的 病因 推导 。 

(三 ) 因果 关联 (causal association) 

统计 学 关联 是 判断 因果 关联 的 前 提 ， 但 只 有 少数 统计 学 关联 属于 因果 关联 。 因 果 关联 可 以 
有 直接 关联 和 间接 关联 , 随 着 研究 的 深入 , 直接 关联 和 间接 关联 可 以 相互 转化 , 原来 认为 是 直 
接 病 因 的 可 以 被 后 来 的 研究 证 明 是 间接 病因 。 我 们 可 以 用 因果 关系 判 断 标 准 (病因 学 研究 评价 
原则 ) 来 推断 所 研究 的 因素 是 否 是 疾病 的 病因 。 图 8-7 概括 了 进行 病 因 推 断 前 必须 考虑 的 问题 
和 步骤 。 

关于 疾病 的 病因 研究 , 一 般 言 之 ， 不 能 依靠 临床 观察 的 方法 来 研究 病因 。 临 床 观察 可 以 积 
累 丰 富 的 经 验 , 它 对 病因 问题 可 以 提供 某 些 疑 点 和 线索 , 或 经 验 性 证 据 。 例如 , 1959 年 至 20 
纪 60 年 代 初 期 关于 海豹 短 肢 畸形 与 孕妇 服用 沙 利 度 胺 (thalidomide ) 的 关系 的 研究 , 这 种 出 生 昌 
陷 先 在 前 联邦 德国 , 后 在 许多 欧洲 国家 流行 , 甚至 在 社会 上 引起 了 奴 慌 。 尽管 是 由 临床 医生 1 
先 提 出 可 疑 之 点 , 即 孕妇 服 过 缓解 妊娠 反应 的 沙 利 度 胺 , 并 怀疑 可 能 同 新 生 儿 短 肢 畸 形 有 关 
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a 人 机 误 六 ) ,7 和 
混杂 仿 估 是 个 
(间接 关联 ) 
因果 推断 Ei 


图 8-7 因果 关联 的 判断 进程 


进而 引起 了 公众 关注 。 但 这 个 重要 的 病因 , 却 是 通过 有 关 国 家 疾病 统计 数字 的 黑 积 ,特别 是 经 
过 分 析 性 流行 病 学 研究 , 才 被 最 终 认定 。 ， 

人 们 往往 有 这 样 一 种 错误 的 看 法 ，_ 提 病因 研究 就 认为 只 是 基础 医学 ( sd 
究 。 其 实 不 然 , 尽管 实验 医学 的 研究 者 可 以 利用 现代 科学 技术 ， 进行 在 有 控制 的 条 件 下 的 类 些 
劲 物 实验 、 组 织 细胞 实验 以 及 分 子 水 平 的 研究 , 以 探索 某 因素 与 疾病 的 因果 关系 。 ee 
只 能 解释 关于 人 类 疾病 过 程 中 整个 生态 系统 的 某 个 个 别 阶段 的 变化 和 规律 。 人 类 是 在 复杂 的 
社会 和 自然 环境 中 生活 的 , 这 与 实验 室 所 控制 的 条 件 .环境 完全 不 同 。 ES 
差异 。 因 此 , 实验 医学 是 重要 的 ,但 其 研究 结果 往往 不 可 轻易 地 引伸 至 人 。 再 者 ， 由 于 医德 的 
原因 ,不 能 在 人 群 中 随意 进行 实验 研究 , 因此 ,关于 疾病 病因 问题 的 研究 , 很 大 程度 上 取决 于 以 
人 为 研究 对 象 的 流行 病 学 研究 或 临床 流行 病 学 研究 , 且 大 多 数 是 观察 性 研究 。 
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yy 立 对 其 进行 
疾病 病 因 与 危险 因素 研究 结果 是 否 能 够 确定 病因 , 其 研究 的 水 平和 价值 多 大 , 应 对 其 进行 


严格 的 评价 。 表 8-5 所 列 是 国际 临床 流行 病 学 有 关 病 因 学 研究 的 评价 原则 , 其 可 以 作为 因果 关 
系 推断 的 参考 标准 。 


表 8-5 ”病因 学 研究 的 评价 原则 
1. 是 否 采 用 了 论证 强度 高 的 研究 设计 方案 
p 除 研究 的 暴露 因素 外 ， 试验 组 与 对 照 组 其 他 方面 是 否 一 致 
@ 包括 RCT 队列 研究 `\ 病 例 对 照 研究 
® 其 他 已 知 的 预后 因素 是 否 一 臻 或 经 过 了 调整 
3. 试验 组 和 对 照 组 有 关 因 果 效应 的 测量 方法 是 否 相同 
昌 有 回忆 性 偏 倚 、 调 查 偏 倚 吗 
@ 是 否 采用 了 育 法 
4. 随访 时 间 是 否 足够 长 ? 研究 结果 包含 了 所 有 随访 病例 吗 
@ 随访 不 完全 的 原因 
® 失 访 病例 与 未 失 访 病例 的 危险 因素 是 否 相 似 
5. 是 否 有 因果 效应 的 时 间 先 后 顺序 
@ 暴 需 先 于 结果 
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续 表 





6. 有 六 
@ 陋 
7. 病因 
8. 病因 和 否 在 不 同 的 研究 中 反映 出 一 致 性 
9. 病因 致 病 效应 和 不 良 反应 发 生 的 生物 学 依据 是 否 充分 
二 、 研 究 结果 的 重要 性 评价 
1. 暴 坊 与 结果 联系 的 强度 如 何 
@ RR、OR 或 EF、NNH 等 
2. 危险 估计 的 精确 性 如 何 
区 间 (95% C7) 
3. 研究 的 样本 此 合适 吗 
、 研 究 结 果 的 适用 性 评价 
1， 你 的 患者 与 文献 中 的 研究 对 象 是 否 存在 较 大 的 差异 、 以 至 于 文献 的 研究 结果 不 能 回答 患者 的 疑问 
2 你 的 患者 发 生 疾病 /不 良 反应 的 危险 性 有 多 大 
3. 确定 你 的 患者 的 喜好 和 希望 解决 的 问题 
4. 是 否 应 终止 接触 暴 坑 因素 或 更 改 治疗 措施 








量 - 反 应 梯度 关系 吗 


致 病 的 因果 关系 

















一 、 病 因 学 研究 结果 的 真实 性 评价 

(一 ) 是 否 采 用 了 论证 强度 高 的 研究 设计 方案 

不 同 的 病因 学 研究 方法 , 其 因果 论证 强度 是 不 同 的 ， 描述 性 研究 论证 强度 最 弱 , 病例 对 照 研 
究 论证 强度 不 太 强 , 队列 研究 论证 强度 较 强 , 随机 对 照 的 临床 试验 最 强 ， 因为 它 来 自 以 人 为 研究 
对 象 的 真正 的 人 体 实验 。 表 8-2 可 作为 评价 不 同 的 设计 方案 所 获得 的 因果 关系 论证 强度 参考 。 

对 于 病因 研究 的 证 据 是 否 来 源 于 真正 的 人 体 实验 ， 是 指 在 研究 中 是 否 将 人 体 置 于 暴露 环境 
中 ,通过 比较 不 同 组 别 的 结局 来 判断 暴露 因素 的 致 病 效应 。 临床 上 多 使 用 随机 对 照 试验 , 具有 
较 强 的 因果 论证 强度 。 但 如 果 在 健康 人 体 中 进行 施加 危险 因素 的 病因 学 实验 ， 显然 是 不 道德 
的 , 并 且 不 具有 可 行 性 。 但 可 以 变通 的 采用 去 除 可 能 的 致 病危 险 因素 的 方法 来 进行 干预 性 研究 
设计 。 这 种 所 谓 的 终止 效应 可 以 来 自 实验 流行 病 学 研究 、 自然 实验 或 自 发 性 改变 的 观察 性 资 
料 。 是 否 存在 终止 效应 也 是 一 个 很 关键 的 标准 ， 也 即 如 果 对 某 些 可 能 的 致 病危 险 因素 或 病因 采 
取 针 对 性 的 措施 之 后 , 能 使 被 研究 的 疾病 发 生 率 下 降 或 流行 随 之 减少 ， 那么 对 病因 或 危险 因素 
的 肯定 也 具有 非常 重要 的 意义 。 

(二 ) 除 研究 的 暴露 因素 外 , 试验 组 与 对 照 组 其 他 暴露 是 否 一 致 ? 是 否 存在 混杂 因素 影响 

混杂 因素 可 能 是 已 知 的 , 也 可 能 存在 未 知 者 , 其 对 病因 研究 影响 颇 大 , 因此 ， 在 拟 探讨 的 致 


























病因 素 之 外 , 应 该 注意 在 试验 组 和 对 照 组 中 是 否 存在 混杂 以 及 混杂 的 程度 , 是 否 采 用 了 适当 的 
控制 或 消除 办 法 。 了 


(三 ) 组 间 对 因果 效应 的 测量 方法 是 否 一 致 是否 采 用 盲 法 

在 病因 学 研究 中 , 对 两 组 研究 对 象 (暴露 组 与 非 暴露 组 ) 应 采用 同样 的 观察 或 调查 方法 、 对 
暴露 (不 良 反应 ) 结 果 应 使 用 相同 的 测量 手段 和 指标 。 且 应 采用 盲 法 来 评价 暴露 结果 , 这 样 才 有 
利于 防止 测量 性 偏 倚 干 扰 , 使 各 项 因果 测试 的 方法 , 指标 一 致 有 利于 对 比 ， 避免 上 述 偏 倚 造 成 
的 影响 , 增加 结果 的 真实 性 。 

(四 ) 随访 观察 时 间 是 否 足够 长 9 研究 结果 是 否 包 括 了 所 有 纳入 随访 研究 的 病例 

任何 致 病因 子 引起 人 体 发 病 都 有 一 个 致 病 的 时 间 效 应 关系 ,急性 及 自然 病程 短 的 疾病 则 至 
病 效应 期 短 , 如 急性 传染 病 。 对 于 慢性 非 传染 性 疾病 则 其 致 病 效应 期 较 长 , 因此 ,研究 慢性 非 传 
染 性 疾病 发 病危 险 因素 的 致 病 效应 时 ,往往 需要 足够 时 间 才 能 观察 到 结果 的 发 生 , 观察 期 过 短 会 
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获得 侵 四 性 结果 。 另 外 ,在 随访 期 间 失 访 过 多 会 影响 研究 结论 的 真实 性 (一 般 失 访 率 不 应 >2096)， 
因为 中 途 退 出 的 研究 对 象 可 能 在 某 些 特征 上 与 仍然 留 在 研究 中 的 研究 对 象 存在 差别 - 

(五 ) 因果 效应 的 时 间 顺 序 是 否 确切 合理 : 

全 号 素 引起 发 病 , 必然 是 因 在 前 , 果 在 后 , 时 序 性 是 构成 因果 关系 的 基础- A 
病 国学 或 不 良 反应 研究 时 ,如果 能 明确 危险 因素 的 出 现 早 于 疾病 或 不 良 反应 的 发 生 ， 则 研究 结 
果 的 真实 性 就 高 。 对 于 实验 性 研究 和 队列 研究 可 以 确定 因果 效应 的 时 间 顺 序 。 而 槛 断面 的 、 加 
顾 性 的 以 及 亿 述 性 研究 则 不 能 确定 因果 效应 的 时 序 性 ， 因此 在 确定 病因 至 病 的 因果 顺序 于 有 
将 让 愉 牙 度 高 、 特 异性 好 的 测量 指标 , 制定 明确 的 诊断 标准 , 证 明 接 触 病因 前 被 研究 对 象 未 串 
有 所 研究 的 疾病 。 

(六 ) 是 否 存 在 剂量 -效应 的 致 gs 

剂量 - 效应 关系 是 指 虹 乱 因素 内 关系 程度 与 疾病 发 生 的 进展 与 程度 存在 显著 的 相关 关 
系 。 前 和 开化 学 作 和 物理 性 有 害 因素 的 损害 作用 , 其 致 病 效 应 的 程度 与 接触 的 剂量 存在 相 可 
接触 的 剂量 越 大 , 以 及 接触 的 时 间 长 , 累积 剂量 大 致 病 效 应 越 明显 , 损害 越 大 。 ep 
蝴 帮 写 可 疑 致 病因 素 的 接触 增加 (剂量 增 大 、 时 间 延 长 ) 导 至 更 多 更 重 的 相关 疾病 的 发 生 ， 则 训 
能 够 肯定 这 一 效应 关系 。 

(七 ) 病因 学 研究 结果 是 否 符合 流行 病 学 的 规律 Me 

流行 病 学 在 致 病因 素 、 机 体 和 环境 等 方面 宏观 地 进行 探讨 ,为 病因 学 研究 党 LC 
发 现 和 有 力 的 证 据 。 研 究 中 的 暴露 的 分 布 , 如 与 疾病 的 地 理 分 布 、 时 间 分 布 及 人 群 间 分 布 符合 
或 基本 符合 , 则 意义 更 天。 

(《 八 ) 不 同 的 研究 , 结论 是 否 _ 致 ws 各 训 

对 于 某 一 疾病 的 病因 , 在 不 同 地 区 不 同人 群 中 采用 不 同 的 或 者 是 相似 的 研究 方法 Ee 
用 相关 的 评价 指标 进行 的 病因 研究 , 所 得 到 结论 如 果 均 一致， 
靠 , 循 证 医学 开展 的 系统 评价 所 提供 的 信息 是 评价 结论 是 否 一 致 的 重要 依据 。 它 是 病因 推 
一 个 重要 的 指标 , 符合 Mill 准则 4 求 同 法 则 。 JJ 上 上 校 

例如 , 吸烟 or aa Es 
大 规模 的 队列 研究 的 结果 均 表明 , 肺癌 与 吸烟 有 很 强 的 关联 。 多 次 研究 的 可 rs tt 
的 可 能 性 增加 , 而 少数 或 个 别 研究 的 不 同 甚或 相反 的 结果 并 不 能 简单 耕 定 ， Wd leat 和- 
差异 的 缘由 。 由 于 临床 病因 学 研究 是 项 较为 复杂 的 过 程 ， ee 
究 者 会 存在 差异 , 因此 所 得 到 的 结论 并 非 都 能 反映 真正 的 因果 关联 , 因此 在 病因 的 一 致 性 分 析 
中 要 持 谨慎 的 态度 , 权衡 研究 设计 、 实 施 过 程 及 其 结果 的 科学 性 。 

( 九 ) 病因 学 效应 的 生物 学 依据 是 否 充 分 a 

如 果 病因 学 研究 揭示 的 因果 关系 有 生物 学 的 可 解释 性 ee 
着 当今 生命 科学 研究 的 飞速 发 展 , 把 临床 流行 病 学 对 致 病因 素 的 宏观 研 冤案 忆 要 出 区 二 中 必 
子 生物 学 、 细 胞 生物 学 、 分 子 病理 学 .组织 学 水 平 、 遗 传 学 和 免疫 学 等 微观 研究 结果 相 结合 ,4 
将 促进 病因 学 研究 的 飞速 、 深 入 发 展 , 将 会 对 疾病 有 更 加 清晰 的 认识 。 


二 、 病 因 学 研究 结果 的 重要 性 评价 
通过 上 述 真实 性 的 分 析 与 评价 ,假设 一 个 病因 学 研究 的 结果 有 大 ea we 
应 该 进一步 地 评价 这 个 研究 结果 有 否 具有 重要 的 临床 或 公共 卫生 学 意义 和 价值 , 否则 就 
要 再 评价 了 。 在 评价 重要 意义 方面 则 应 有 量化 的 相应 指标 。 
(一 ) 关联 的 强 弱 程度 PH 让 
在 病因 学 研究 的 方法 中 有 一 些 反映 虹 志 与 疾病 的 因果 关联 程度 的 量化 指 怀 。 
验 以 及 队列 研究 中 ,常用 相对 危险 度 (RR)、 归 因 危 险 度 (4R)、RRI、NNT 等 来 评价 因果 关联 强 
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度 , 病例 对 照 研究 则 多 用 优势 比 (OR ) 进 行 评价 。 

在 判断 RR 和 OR 的 意义 时 ， 还 要 进行 敏感 性 分 析 (sensitivity analysis ), 这 有 助 于 对 潜在 的 
混杂 因素 进行 “调整 "或 “修正 "。 如 果 调整 后 的 RR 或 OR 较 调 整 前 的 RR 或 OR 明显 变 小 , 则 应 
该 怀疑 原来 的 结果 。 相 反 , 如 果 调整 后 的 RR 或 OR 与 调整 前 相 比 保持 不 变 或 比 调整 前 明显 增 
大 , 则 可 以 更 确信 该 因果 关联 的 真实 性 。 

(二 ) 相对 危险 度 (RR) 或 优势 比 (OR) 的 95% 可 信和 区间 

除 评价 因果 关系 的 点 估计 强度 外 ， 还 需 评价 其 精确 度 ， 方法 是 计算 RR 或 OR 等 指标 的 95% 
可 信 区 间 , 如 果 95% CI 的 范围 较 狭小 、 则 其 精确 度 就 高 ， 下 限 和 上 限 值 不 包括 1.0， 表明 有 统计 
学 意义 。 如 果 研 究 发 现 暴露 因素 与 疾病 暴露 因素 与 疾病 /不 良 反应 存在 相关 性 , 则 可 信 区 间 下 
限 表 示 相 关 强 度 的 最 低 值 ， 如 果 研 究 未 发 现 两 者 的 关系 ( 没有 统计 学 意义 ), 则 可 信和 区间 的 上 限 
表示 相关 强度 可 能 达到 的 最 高 水 平 。 

(三 ) 害 - 需 暴露 人 数 

害 - 需 暴 露 人 数 (number needed to harm， NMVB) 是 指 多 少 人 暴露 于 危险 因素 /干预 措施 ， 就 可 
能 比 非 暴露 组 多 发 生 1 例 疾 病 /不 良 反 应 。NNH 是 一 种 更 直观 、 更 易 被 临床 医生 理解 的 表示 因 
果 相关 强度 的 指标 。NNH 为 4R 的 倒数 , 即 NNH= 1/4R。 在 疗效 评价 不 良 反 应 研究 中 ， 则 可 称 
之 为 害 - 需 治 人 数 。 在 疗效 评价 研究 中 ， 其 相对 应 的 指标 为 NNT(number needed to treat， 益 - 需 
治 人 数 )。 





三 、 病 因 学 研究 结果 的 适用 性 评价 

在 评价 了 病因 和 危险 因素 研究 结果 的 真实 性 和 重要 性 后 , 如 果 这 些 研究 证 据 具有 良好 的 真 
实 性 , 而且 又 具有 临床 或 公共 卫生 学 的 重要 意义 ,那么 应 联系 患者 的 实际 情况 来 探讨 病因 和 和 危 
险 因素 ,以 助 于 解决 患者 的 实际 问题 , 所 以 我 们 还 需 考虑 该 研究 证 据 的 结果 是 否 能 够 用 于 我 们 
自己 的 患者 或 公共 卫生 实践 。 

(一 ) 你 的 患者 与 文献 中 的 研究 对 象 是 否 存在 较 大 的 差异 , 以 至 于 文献 的 研究 结果 不 能 回答 
患者 的 疑问 

当 考 虑 研究 证 据 的 适用 性 时 ,首先 要 比较 你 的 患者 与 研究 证 据 中 的 研究 对 象 在 年 龄 、 性别、 
经 济 收入 文化 背景 等 社会 学 特征 及 疾病 严重 程度 、 病 程 、 用 药剂 量 、 依 从 性 、 对 治疗 的 反应 性 
等 临床 特征 等 方面 的 差异 。 如 果 存 在 影响 结局 的 重要 差异 , 可 能 研究 证 据 就 不 能 用 于 解决 你 的 
患者 的 问题 , 或 具体 实践 。 

(二 ) 你 的 患者 发 生 疾病 /不 良 反应 的 危险 性 如 何 

针对 单个 病人 的 问题 , 需要 根据 研究 证 据 提供 的 信息 , 估计 你 的 患者 发 生 疾病 / 不 良 反应 
的 危险 性 。_ 一 种 方法 是 在 文献 中 寻找 与 你 的 患者 各 方面 特征 比较 一 致 的 亚 组 , 参照 该 亚 组 的 
NNH, 但 在 这 种 情况 下 , 一 定 要 慎重 , 因为 亚 组 的 样本 量 常常 较 少 , 受 机 遇 的 影响 较 大 。 另 一 种 
方法 是 , 计算 患者 发 生 疾病 /不良 反应 的 可 能 性 与 文献 报告 可 能 性 的 比值 FCdecimal fraction )， 
然后 用 文献 结果 中 的 NVE 除 以 下 值 , 获得 你 的 患者 发 生 疾病 /不 良 反应 的 危险 性 大 小 。 

(三 ) 确定 你 的 患者 的 喜好 和 希望 解决 的 问题 

医务 人 员 在 进行 医疗 决策 时 , 除了 参考 研究 证 据 提供 的 信息 , 坚持 利 大 于 二 的 原则 同时 还 
应 邀请 患者 参与 医疗 决策 。 病 人 参与 医疗 决策 是 为 了 尊重 患者 的 权利 , 不 同 的 病人 因 其 对 自身 
疾病 的 关心 程度 , 对 医生 所 给 予 的 诊治 措施 的 期 望 值 及 对 不 良 反应 的 耐 受 性 等 的 不 同 , 最 终 的 
选择 会 有 差别 。 我 们 可 以 调查 患者 的 喜好 , 提供 一 系列 代表 危险 性 和 良好 结局 的 价值 尺度 ,了 
解 患者 在 哪 一 点 时 会 改变 他 们 的 决定 , 即 接受 或 拒绝 治疗 措施 (暴露 )。 

(四 ) 是 否 应 终止 接触 暴露 因素 或 更 改 治疗 措施 9 

如 果 研 究 证 据 显示 暴露 因素 与 疾病 /不 良 反应 间 具 有 较 强 的 因果 联系 , 即 接触 危险 因素 的 
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危险 明确 而 且 巨 大 , 决策 就 很 明确 , 即 立即 脱离 接触 危险 因素 或 终止 治疗 措施 。 对 于 不 良 反 应 
因果 关系 研究 来 说 , 即使 证 据 显示 暴露 因素 (治疗 措施 ) 与 疾病 /不 良 反应 间 因 果 相 关 性 不 是 太 
强 ,但 有 其 他 药物 可 选 也 容易 作出 决策 。 在 临床 实践 中 , 同一 种 疾病 常常 有 多 种 治疗 措施 可 供 
选择 。 因 此 , 医生 应 告知 患者 和 与 患者 讨论 每 一 种 措施 的 利弊 , 最 后 决定 采用 哪 一 种 治疗 措施 。 

以 上 所 列 病因 学 研究 和 评价 的 依据 , 实际 应 用 中 可 以 根据 研究 要 求 综合 参考 , 灵活 运用 。 
可 以 根据 不 同 的 研究 设计 ,有 所 侧重 地 运用 其 中 的 条 款 。 另 外 , 上述 原则 也 可 作为 阅读 和 分 析 
病因 学 的 文献 时 , 鉴别 真 伪 的 参考 尺度 。 




















第 五 节 ” 循 证 实践 及 案例 分 析 


一 .疾病 案例 
患者 女性 , 68 岁 。 以 “跌倒 1 小 时 ”为 主诉 人 院 。 入 院 当晚 在 夜间 起 床 去 卫生 间 过 程 中 跌 
倒 。 入 院 后 X 线 检查 , 发 现 “ 左 侧 股骨 嵌 插 性 骨折 ”。 在 骨科 进行 了 内 固定 手术 。 经 询问 病史 得 
知 , 患者 有 睡眠 障碍 10 年 ,长 期 睡 前 服用 茶 二 氨 草 类 药物 ( 艾 司 唑 仑 )。 因 此 , 主治 医生 希望 了 
患者 夜间 跌倒 发 生 骨 折 是 否 与 长 期 服用 苯 二 氮 草 类 药物 有 关 。 


二 .提出 问题 

医生 在 给 患者 采用 任何 干预 措施 前 需要 明确 , 该 干预 措施 可 能 引起 的 不 良 反 应 , 其 造成 的 
伤害 是 否 小 于 治疗 带 来 的 益处 , 尤其 在 面 对 不 同 个 体 时 , 患者 的 基础 状况 、 特异 性 体质 和 合并 
药 情况 均 需 要 评估 , 以 考虑 是 否 会 增加 治疗 的 不 良 反应 。 对 于 本 病例 , 患者 有 睡眠 障碍 , 且 
一 直 在 服用 葵 二 氮 草 类 药物 , 主治 医师 希望 了 解 长 期 服用 苯 二 氮 章 类 药物 是 否 会 增加 患者 骨折 
的 风险 , 这 显然 是 一 个 药物 不 良 反 应 的 问题 , 是 了 解 长 期 服用 苯 二 氮 草 类 药物 与 骨折 之 间 是 否 
存在 因果 关联 的 问题 , 从 循 证 实践 的 角度 , 要 明确 这 个 问题 就 必须 进行 全 面 的 文献 搜索 , 以 了 
解 相关 的 证 据 。 基 于 这 个 初始 临床 问题 , 为 了 能 够 准确 检索 相关 的 证 据 , 需要 进行 相应 的 问题 
转换 , 构建 相应 的 临床 问题 。 

目前 ,通用 的 构建 临床 问题 的 方法 是 遵循 PICO 原则 , 即 构建 问题 的 四 个 要 素 : 研究 对 象 
(patient)、 和 干预 措 施 (intervention ) .与 干预 措施 相 比较 的 措施 (comparison intervention ) 和 产生 的 
结局 (outcome )。 本 例 ， 依照 该 原则 构建 过 程 见 表 8-6。 












































表 8-6 遵循 PICO 原则 的 构建 过 程 


P: 患者 睡眠 障碍 患者 

1: 干预 措施 长 期 服用 葵 二 氨 草 类 药物 
C: 比较 措施 不 用 药 

0: 结局 骨折 





经 过 转换 后 的 问题 是 : 长 期 服用 芋 二 氮 草 类 药物 的 患者 与 未 服用 该 药 的 患者 相 比 , 是 否 会 
增加 发 生 上 骨折 的 风险 ? 


三 、 证 据 检索 与 评价 
尘 如 烟 海 的 医学 信息 中 , 要 快速 地 获得 所 需要 的 资料 ,需要 掌握 文献 检索 的 方法 和 技巧 ， 
包括 检索 词 以 及 文献 数据 库 的 选择 ,检索 策略 的 制定 等 。 由 于 不 同文 献 资料 的 质量 不 同 , 研究 


的 设计 和 实施 、 数 据 的 整理 与 分 析 、 结 果 的 解释 和 论文 报告 等 方面 存在 差异 , 研究 的 真实 性 和 
可 靠 性 以 及 适用 性 也 不 同 。 在 循 证 医学 实践 中 , 建议 首先 检索 二 次 数据 库 , 即 经 他 人 评估 和 得 
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选 过 的 循 证 医学 资源 , 如 Cochrane 图 书馆 、Clinical Evidence 等 , 如 未 检索 出 所 需要 的 信息 , 再 进 
一 步 检索 未 经 筛选 的 数据 库 , 如 PubMed、Springerlink、CBM、 中 国 期 刊 全 文 数据 库 等 。 

针对 上 述 临 床 问题 ,具体 文献 检索 策略 的 制定 请 读者 参照 本 教材 相关 内 容 , 本 章 仅 以 
“Benzodiazepine” 和 “fracture”( 中 文 数据 库 以 “ 茶 二 氮 草 类 ” 和 “骨折 ”) 为 检索 词 进行 检索 ,检索 
日 期 为 2012 年 7 月 18 日。 检索 结果 见 表 8-7。 





表 8-7 检索 结果 
数据 库 检索 结果 与 本 例 临 床 问题 相关 

PubMed 219 39 
CBM . 1 0 
中 国学 术 期 刊 网 7 0 
维普 资讯 1 

万 方 数据 库 2 0 
OvidSP 11755 36 
Springerlink 2835 16 
Wiley 1549 12 
Clinical evidence 6 6 
ACP Journal Club 和 下 
The Cochrane Library 35 1 





循 证 实践 在 回答 临床 问题 时 , 应 首先 选择 针对 该 问题 的 系统 评价 ( systematic review), 因为 
系统 评价 客观 总 结 了 所 有 相关 的 文献 资料 , 其 作为 证 据 的 论证 强度 最 高 。 本 例 经 去 重 后 , 共 在 
国内 外 的 11 个 数据 库 中 检索 到 相关 文献 70 篇 , 经 过 进一步 评价 筛选 , 本 章 分 别 选取 队列 研究 和 
系统 评价 各 1 篇 ,分 别 是 Anita K. Wagner 等 的 队列 研究 Benzodiazepine Use and Hip Fractures in the 
Elderly—— Who 1s at Greatest Risk?( Arch Intern Med, 2004, 164: 1567-1572) 及 T.P. Khong 等 的 系 
统 评价 Potential Jmpact of Benzodiazepine Use on the Rate of Hip Fractures in Five Large European 
Countries and the United States( Calcif Tissue Int, 2012, 91: 24-31), 参照 表 8-2 分 别 对 其 真实 性 、 重 
要 性 和 适用 性 进行 评价 , 以 指导 循 证 实践 , 回答 提出 的 临床 问题 。 


四 、 实践 决策 


(一 ) 队列 研究 : Benzodiazepine Use and Hip Fractures in the Elderly———Who ls at Greatest 
Risk?(Arch Intern Med, 2004, 164: 1567-1572) 

1. 真实 性 评价 

(1) 是 否 采用 了 论证 强度 高 的 研究 设计 方法 ; 依据 表 8-2, 在 病因 研究 设计 类 型 上 , 以 随机 对 
照 试验 (RCT) 的 论证 强度 最 高 , 其 次 是 队列 研究 。 通 过 检索 得 知 , 目前 关于 此 临床 问题 的 RCT 研 
究 较 少 , 大 多 为 队列 研究 和 和 集 式 病例 对 照 研究 , 而 本 研究 即 属 前 瞻 性 的 队列 研究 , 论证 强度 较 高 。 

(2) 除 研究 的 暴露 因素 外 , 试验 组 与 对 照 组 其 他 方面 是 否 一 致 : 本 研究 为 队列 研究 , 尽管 不 
能 像 随 机 对 照 试验 一 样 严格 控制 组 间 的 可 比 性 , 但 暴露 组 与 非 暴露 组 均 来 自 同 一 队列 , 因此 组 
间 的 可 比 性 应 该 是 有 保证 的 。 

(3) 试验 组 和 对 照 组 有 关 因 果 效 应 的 测量 方法 是 否 相 同 (结果 测量 是 否 客观 或 采用 盲 法 ): 
本 研究 数据 来 源 于 New Jersey Medicaid health care claims data, 根据 以 往 和 当前 的 药物 使 用 和 诊 
断 信息 , 将 研究 对 象 分 配 到 葵 二 氨 草 类 药物 暴露 组 和 非 暴露 组 。 骨 折 的 诊断 则 根据 国际 疾病 分 
类 代码 (第 9 版 )820.xx 进行 。 因 此 , 本 研究 暴露 组 和 对 照 组 的 测量 方法 应 当 是 客观 且 一 致 的 。 
研究 中 暴露 因素 和 结局 的 测量 均 采用 标准 化 的 方法 , 因此 不 存在 言 法 的 问题 。 

(4) 随访 时 间 是 否 足够 长 ? 研究 结果 包含 了 所 有 随访 病例 吗 : 文中 表明 , 研究 者 对 研究 对 象 
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进行 了 为 期 42 个 月 的 随访 。 研 究 共 对 125 203 名 研究 对 象 进行 了 随访 , 报告 的 研究 结果 包含 了 
所 有 的 随访 病例 。 

(5) 是 否 有 因果 效应 的 时 间 先 后 顺序 : 本 研究 属 前 脆性 队列 研究 , 特点 就 是 在 特定 人 群 中 按 
照 目前 或 过 去 是 否 暴露 于 待 研究 的 危险 因素 , 分 为 暴露 与 非 暴露 组 , 随访 观察 一 段 时 间 后 , 进 
而 比较 待 研究 疾病 的 发 病 率 。 因 此 , 因果 时 相关 系 是 明确 的 。 

(6) 是 否 存 在 剂量 - 反应 梯度 关系 : 文中 虽 提 到 了 在 收集 资料 的 过 程 中 采用 地 西洋 当量 (mg) 
统一 评 佑 药物 使 用 剂量 , 但 在 结果 分 析 过 程 中 并 未 涉及 剂量 - 反应 梯度 关系 。 

(7) 病因 学 研究 的 结果 是 否 符合 流行 病 学 的 规律 : 关于 暴露 因素 ( 葵 二 氮 草 类 药物 使 用 ) 与 
疾病 /不 良 反应 (骨折 ) 是 否 存在 消长 关系 , 本 文中 未 提 及 。 

(8) 病因 致 病 的 因果 关系 是 否 在 不 同 的 研究 中 反映 出 一 致 性 : 本 研究 结果 显示 , 服用 茶 二 
氮 草 类 药物 会 使 发 生 骨 折 的 风险 增加 0.24 倍 (RR = 1.24, 95% C1: 1.06~1.44), 与 诸多 研究 如 
Lichtenstein( 1994), Wang(2001), Cummings(1995), Chang(2008 ) 等 一 致 。 但 也 有 部 分 研究 结果 
未 得 出 这 一 结论 , 如 Ensrud(2003), Ray(1989), Sgadari(2000) 等 研究 。 因 此 , 需 进一步 对 此 类 
研究 进行 系统 评价 , 通过 增 大 样本 含量 , 减少 随机 误差 所 致 的 差异 以 提高 统计 效率 ; 探讨 多 个 
研究 结果 间 的 异 质 性 , 实现 不 一 致 的 研究 结果 的 定量 综合 估计 。 

《9 ) 病因 致 病 效应 和 不 良 反应 发 生 的 生物 学 依据 是 否 充分 : 此 种 因果 关系 的 生物 学 依据 至 
今 尚 不 明了 ,文中 也 未 提 及 。 

2. 重要 性 评价 

(1) 关联 的 强度 (OR 或 RR): 与 未 服用 茶 二 氮 革 类 药物 (BZD ) 组 相 比 , 服用 BZD 组 的 调整 JRR 
值 为 1.24, 长 半衰期 BZD 组 为 1.13, 短 半衰期 高 效 BZD 组 为 1.27, 短 半衰期 低 效 BZD 组 为 1.22， 
服用 超过 一 种 BZD 组 为 1.53, 服用 少 于 15 天 BZD 组 为 2.05, 服用 16~30 天 BZD 组 为 1.88, 持续 
服用 BZD 组 为 1.18。 

(2) 相对 危险 度 ( RR) 或 优势 比 ( OR) 的 95% 可 信 区 间 : 与 上 述 IRR 相对 应 的 95% 可 信 区 间 
分 别 为 (1.06~1.44), (0.82~1.55),(1.01~1.59), (0.89~1.67), (0.92~2.53), (1.28~3.28), (1.15~3.07), 
(1.03~1.35 )。 除 长 半衰期 BZD 组 , 短 半衰期 低 效 BZD 组 , 服用 超过 一 种 BZD 组 外 , 均 有 统计 学 

(3) 害 - 需 暴 露 人 数 (NVH): 本 例 中 随访 资料 以 人 年 为 单位 , 因此 可 以 发 病 密度 来 计算 NNH,， 
以 服用 BZD 组 为 例 , NVH= 1/(347/19 956.0- 1965/174 115.0)= 163.88, 即 每 暴露 163.88 人 年 会 
发 生 一 例 骨 折 。 

3. 适用 性 评价 

(1) 你 的 患者 与 文献 中 的 研究 对 象 是 否 存在 较 大 的 差异 : 由 文中 的 一 般 人 口 学 描述 中 可 知 ， 
本 例 中 研究 对 象 为 65 岁 以 上 老年 人 , 因此 , 研究 结果 应 该 适用 于 该 患者 。 

(2) 患者 发 生 疾病 /不 良 反应 的 危险 性 如 何 : 根据 患者 的 情况 与 文中 对 比 , 该 患者 应 属于 持 
续 服用 BZD 亚 组 , 该 组 NNH=1/(305/18290.8 一 1965/174115.0)=185.56。 该 亚 组 人 数 为 24 042 
人 , 随访 人 时 数 为 18 290.8 人 年 ,样本 量 较 大 , 应 可 避免 受 机 遇 的 影响 。 

(3) 是 否 应 终止 接触 暴露 因素 或 更 改 治疗 措施 : 研究 证 据 显 示 该 暴露 因素 与 不 良 反 应 间 具 
有 一 定 的 因果 相关 性 , 但 关联 强度 较 弱 。 但 患者 睡眠 障碍 的 治疗 也 不 应 忽视 。 应 与 专科 医生 会 
诊 后 , 结合 病人 的 意愿 进行 决策 。 

(二 ) 系统 评价 : Potential Impact of Benzodiazepine Use on the Rate of Hip Fractures in 
Five Large European Countries and the United States( Calcif Tissue Int, 2012, 91: 24-31) 

1. 研究 结果 的 真实 性 

(1) 是 否 是 根据 随机 对 照 试验 进行 的 系统 评价 : 是 否 纳入 高 质量 的 原始 文献 , 是 评价 系统 评 
价 作 为 证 据 的 论证 强度 高 低 的 重要 标准 。 随 机 对 照 试 验 能 够 较 好 地 控制 各 种 偏 倚 对 结局 的 影 

















第 八 章 “病因 与 危险 因素 的 研究 、 评 价 与 循 证 实践 


响 , 是 评价 干预 措施 疗效 的 最 佳 设计 方 案 , 因此 依据 随机 对 照 试验 产生 的 系统 评价 , 其 研究 证 
据 的 论证 强度 被 认为 最 高 。 但 该 方法 多 用 治疗 措施 的 有 效 性 评价 , 而 限于 伦理 学 的 要 求 , 不 良 
反应 研究 则 较 少 应 用 。 通 过 检索 也 得 知 , 目前 关于 此 临床 问题 的 RCT 研究 较 少 , 大 多 为 前 脆性 
的 队列 研究 和 策 式 病例 对 照 研究 ,本 系统 评价 研究 为 包含 欧洲 五 个 国家 (法 国 、 德 国 、 意大利 、 
西班牙 和 英国 ) 和 美国 在 内 的 多 个 研究 的 系统 评价 , 是 对 多 个 队列 研究 和 梨 式 病例 对 照 研究 的 

(2) 在 系统 评价 的 “方法 学 " 部 分 , 是 否 描述 了 检索 和 纳入 所 有 相关 研究 的 方法 ? 评价 单个 
研究 证 据 的 方法 : 文中 清晰 的 说 明 研究 者 以 hip fractures 和 benzodiazepines 相关 词 条 为 检索 词 ， 
于 2010 年 9 月 和 10 月 在 PubMed \the Cochrane Library 和 Embase 等 数据 库 进行 了 系统 检索 , 而 
未 公开 发 表 的 数据 未 纳入 研究 。 

文中 虽 未 提 及 评价 单个 研究 证 据 的 具体 方法 , 但 明确 给 出 了 5 条 纳入 标准 以 保证 单个 研究 
的 质量 。 

(3) 不 同 研究 的 结果 是 否 一 致 : 所 纳入 的 原始 文献 中 , 关于 长 期 服用 茶 二 氮 革 类 药物 是 否 会 
增加 发 生 骨 折 的 风险 , 结论 莫衷一是 。 但 系统 评价 /meta 分 析 的 主要 作用 即 是 对 具有 相同 研究 
目的 的 多 个 研究 结果 进行 综合 定量 分 析 的 一 种 方法 , 其 优点 是 通过 增 大 研究 样本 含量 , 减少 随 
机 误差 所 致 的 差异 以 提高 统计 效率 ; 探讨 多 个 研究 结果 间 的 异 质 性 , 实现 不 一 致 的 研究 结果 的 
定量 综合 估计 。 本 系统 评价 共 纳 入 了 11 项 研究 的 14 组 数据 , 其 中 8 组 数据 为 阳性 结果 , 即 服 
用 葵 二 氮 草 类 药物 会 增加 骨折 发 生 的 风险 , 而 另外 6 组 数据 未 能 得 出 此 结论 。 另 外 , 本 文 还 采 
用 异 质 性 检验 的 方法 来 判断 不 同 研究 的 结果 的 异 质 性 。 结 果 显 示 , 值 为 42%~66%, 表明 存在 
一 定 的 异 质 性 。 

(4) 统计 分 析 用 的 数据 资料 是 单个 患者 的 资料 还 是 单个 研究 的 综合 资料 : 系统 评价 的 资料 
来 源 可 以 是 原始 研究 中 群体 资料 , 也 可 以 是 原始 研究 中 的 个 体 资料 , 两 种 类 型 各 有 优 缺 点 , 应 
根据 研究 要 求 和 已 有 条 件 进 行 选 择 。 根 据 文中 的 内 容 可 知 , 本 系统 评价 统计 分 析 中 所 使 用 的 数 
据 资料 为 单个 研究 的 综合 资料 。 

2. 研究 结果 的 重要 性 

(1) 发生 不 良 反应 的 强度 大 小 如 何 ( 效 应 测量 指标 的 大 小 ): 本 研究 中 通过 对 多 个 研究 进行 
meta 分 析 后 , 直接 给 出 了 合并 后 的 RR 值 为 1.40, 表明 服用 葵 二 氮 草 类 药物 发 生 骨 折 的 风险 是 不 
服用 莱 二 氮 草 类 药物 的 1.4 倍 。 而 原始 文献 的 提供 的 RR 值 为 1.09~2.05 不 等 。 长 效 葵 二 氮 草 类 
药物 的 RR 值 为 1.32, 短 效 的 RR 值 为 1.23。 

(2) 发 生 不 良 反应 的 精确 性 如 何 (可 信 区 间 的 大 小 ): 与 单个 研究 结果 一 样 , 系统 评价 结果 的 
可 信 区 间 可 以 提供 关于 研究 结果 精确 性 的 信息 , 若 可 信 区 间 较 宽 , 则 表示 精确 性 较 低 , 反之 则 
表示 研究 结果 的 精确 性 较 高 。 本 文中 也 直接 给 出 了 95% 可 信 区 间 , 为 (1.24~1.58 )。 长 效 和 短 效 
药 的 95% CI 分 别 为 (1.10~1.58) 和 (1.09~1.39)。 

3. 研究 结果 的 适用 性 

(1) 你 的 病人 是 否 与 系统 综述 中 的 研究 对 象 差异 较 大 , 导致 结果 不 可 用 : 由 纳入 的 文献 可 知 ， 
多 数 文献 中 的 研究 对 象 为 65 岁 以 上 老年 人 , 因此 ,研究 结果 应 该 比较 适用 于 该 患者 。 

(2) 规避 不 良 反应 的 措施 在 你 的 医院 是 否 可 行 : 茶 二 毛 草 类 药物 是 临床 治疗 睡 眼 障碍 的 常规 
用 药 之 一 , 但 不 是 唯一 治疗 用 药 , 因此 可 以 根据 医生 的 经 验 和 病人 的 取向 选用 其 他 替代 药物 。 

(3) 你 的 病人 从 治疗 中 获得 的 利 整 如 何 : 选用 其 他 替代 药物 , 在 控制 患者 睡眠 障碍 的 同时 ， 
又 能 够 有 效 减少 骨折 等 不 良 反应 的 发 生 , 患者 无 疑 将 从 中 获 益 。 

(4) 对 于 治疗 的 疗效 和 不 良 反应 , 你 的 患者 的 价值 观 和 选择 如 何 : 临床 医生 应 该 根据 自己 掌 
握 的 证 据 , 耐心 细致 的 向 患者 阐述 更 换 治疗 方法 的 利 与 整 , 最 后 结合 患者 的 价值 观 和 选择 , 进 
行 临 床 决 策 。 
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五 .小 结 





眠 障碍 药物 ,并 做 好 防范 措施 , 防止 跌倒 等 。 





综 上 所 述 , 该 患者 骨折 的 发 生 或 与 长 期 服用 茶 二 氮 荣 类 药物 有 关 , 应 建议 改 用 其 他 治疗 用 


( 孙 业 醒 ) 
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诊断 试验 涉及 临床 症状 、 特 殊 体征 、 各 种 实验 室 检 查 以 及 特殊 检查 , 是 临床 诊断 与 鉴别 诊 
断 的 重要 工具 。 开 展 诊 断 试 验 的 目的 是 寻找 简便 、 安 全 、 经 济 并 为 患者 易 接受 的 方法 用 以 车 代 
复杂 、 高 风险 、 高 成 本 或 者 临床 操作 困难 的 检查 措施 。 最 佳 研究 设计 为 采用 与 金 标准 方 法 同 其 
讶 法 比较 的 诊断 试验 。 诊 断 试 验 评价 指标 包括 敏感 度 、 特 异 度 、 预 测 值 、 似 然 比 及 受 试 者 工作 
曲线 。 应 用 诊断 试验 结果 进行 循 证 医学 实践 时 , 应 注意 评估 诊断 试验 研究 的 科学 性 、 重 要 性 以 
及 适用 性 。 






第 一 节 ”研究 和 评价 诊断 性 试验 的 意义 


诊断 试验 (diagnostic test ) 可 为 疾病 正确 诊断 以 及 鉴别 诊断 提供 重要 证 据 。 诊断 试验 的 实 
施 , 要 涉及 以 下 内 容 : 病史 和 体检 所 获得 的 临床 资料 ; @ 各 种 实验 室 检查 , 如 生化 、 血 液 学 、 细 
菌 性 .免疫 学 、 病 理学 检查 等 ; @ 各 种 影像 学 检查 , 如 X 线 造 影 、B 超 、CT、 磁 共振 成 像 (MRI) 及 
放射 性 核 素 等 ; @ 其 他 特殊 器 械 检查 , 如 心电图 、 内 镜 等 ; @ 各 种 临床 公认 的 诊断 标准 : 如 各 种 
自身 免疫 性 疾病 的 联合 诊断 标准 等 。 

诊断 试验 主要 用 于 诊断 或 者 排除 某 种 疾病 , 其 他 用 途 还 包括 : 判断 疾病 的 严重 程度 ; @ 估 
计 疾 病 的 临床 过 程 、 治 疗效 果 及 其 预后 ; @ 筛 检 无 症状 的 病人 ; @ 监 测 药物 不 良 反 应 。 

尽管 自前 常见 疾病 的 诊断 标准 与 诊断 措施 已 先后 确立 , 但 由 于 新 疾病 、 新 诊断 方法 的 不 断 
涌现 , 仍 不 能 满足 临床 对 诊断 研究 证 据 日 益 增长 的 需求 , 特别 是 在 以 下 几 个 方面 : @ 新 的 疾病 
缺乏 诊断 “ 金 标准 ", 需要 发 展 诊断 试验 并 对 其 进行 评价 ; @ 新 的 诊断 方法 , 如 各 种 新 的 影像 检 
查 、 各 种 分 子 生物 学 检测 方法 是 否 优 于 现 有 的 方法 , 是 否 适合 在 临床 开展 , 其 安全 性 和 经 济 性 
等 都 需要 评估 ; @ 多 种 诊断 试验 如 何 合理 安排 .次 序 如 何 确定 也 需 科 学 地 决策 。 因 此 , 诊断 试 
验 研究 与 评价 的 意义 及 其 临床 重要 性 是 显而易见 的 。 
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评价 一 项 新 诊断 方法 的 诊断 价值 , 最 佳 研究 设计 是 采用 与 金 标准 (gold standard ) 方 法 同期 
言 法 比较 的 诊断 试验 。 第 一 ,确立 疾病 的 标准 诊断 方法 (最 好 是 金 标准 ), 第 二 , 选择 研究 对 象 ， 
并 根据 标准 诊断 将 这 些 对 象 划分 为 “有 病 组 - 病例 组 " 与 "无 病 组 - 对 照 组 ,第 三 , 再 用 新 诊断 
方法 同步 测试 这 些 研究 对 象 , 将 获得 的 诊断 结果 与 标准 诊断 比较 , 进而 绘制 四 格 表 , 计算 敏感 
度 、 特 异 度 、 预 测 值 、 似 然 比 等 指标 来 综合 评价 该 试验 的 诊断 效率 和 价值 。 为 减少 偏 倚 , 一 般 采 
用 育 法 评价 。 
一 、 确 定 诊断 试验 评价 的 金 标准 诊断 

标准 诊断 , 又 叫做 “ 金 标准 "诊断 ,是 指 当前 临床 医学 界 公认 的 、 诊 断 某 疾病 的 最 可 靠 方法 ， 
常用 的 金 标准 诊断 方法 有 病理 学 诊断 (组 织 活检 和 尸体 解剖 ) 外 科 手 术 发 现 、 特 殊 影像 学 诊断 
(如 冠状 动脉 造影 诊断 冠 心病 ), 也 可 采用 公认 的 临床 诊断 标准 (如 系统 性 红斑 狼疮 的 ARA 诊断 
标准 等 ), 通过 长 期 临床 随访 所 获得 的 肯定 诊断 ,有 时 也 可 用 作 金 标准 诊断 。 

gl 

















t 
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开展 诊断 试验 时 ， 金 标准 诊断 的 选择 应 结合 临床 具体 情况 而 定 。 例 如 肿 辣 诊断 的 金 标准 是 
病理 从 断 , 冠 心病 诊断 最 好 选用 和 冠状 动脉 造影 ,胆石 症 诊断 则 一 般 以 手术 发 现 为 准 。 若 金 标准 
选择 不 当 , 就 会 造成 “病例 组 "和 “对 照 组 ” 的 划分 错误 , 从 而 影响 诊断 试验 的 正确 评价 。 同 时 ， 
临床 诊断 试验 还 要 遵循 临床 研究 及 伦理 学 的 一 此 基本 原则 ， 如 不 损害 患者 原则 、 伦理 委员 会 通 
过 原则 、 患 者 知情 同意 原则 等 ， 变相 增加 了 人 金 标准 操作 的 难度 , 有 时 要 根据 具体 临床 疾病 , 选择 
临床 公认 上 且 得 到 广泛 应 用 的 诊断 方法 作为 爹 标准 ， 如 诊断 冠 心病 的 金 标准 是 冠 脉 血管 造影 , 但 
造影 有 一 定 风险 、 操 作 存在 一 





一 、 诊 断 试 验 研究 对 象 的 选择 和 样本 量 的 确定 

诊断 试验 的 研究 对 象 应 具有 代表 性 ， 其 中 病例 组 应 包括 各 种 临床 类 型 和 处 于 不 同 病 程 阶段 
的 病人 : 如 轻 、 中 、 重 型 , 早 、 中 、 晚 期 , 典型 的 和 不 典型 的 , 有 和 无 并 发 症 者 , 已 治疗 与 未 经 治 者 
等 。 对 照 组 应 选 自 确 未 洽 患 该 病 的 其 他 病例 ， 尤其 应 包括 易 与 该 病 相 混淆 的 病例 , 设置 这 样 的 
克昭 才 具 有 鉴别 诊断 的 价值 。 在 试验 研究 初期, 有 时 也 可 选 正常 人 作为 对 照 组 。 研 究 对 象 应 同 
期 进入 研究 ， 可 以 是 连续 样本 或 者 是 按 比例 抽取 的 样本 , 但 不 能 由 研究 者 随意 选择 , 否则 就 会 
出 现 选择 偏 倚 , 影响 试验 的 真实 性 。 

诊断 试验 研究 的 样本 量 与 下 列 因 素 有 关 ; D 对 试验 敏感 度 的 要 求 , 即 假 阴性 率 要 控制 在 什 
各 水 下 ,敏感 度 高 的 试验 一 般 用 于 疾病 的 第 选 ; @ 对 试验 特异 度 的 要 求 , 即 假 阳性 率 要 控制 在 
什么 水 平 ,特异 度 高 的 试验 一 般 用 于 肯定 诊断 ; @ 多 许 误差 ,一 般 取 总 体 率 100( 1 一 a)% 可 信 区 
间 宽 度 的 一 半 。 

计算 公式 : n=[ uap(1-p)]/5, 





三 、 绘 制 四 格 表 
诊断 试验 的 设计 ,首先 应 绘制 四 格 表 ( 表 9-1)。 纵 列 为 根据 金 标准 诊断 划分 的 “病例 组 ”及 
_ 对照 组 结果 , 而 待 评价 的 诊断 试验 结果 则 横向 排列 。 当 同步 检测 这 两 组 对 象 后 ,将 阳性 结果 
列 为 诊断 试验 的 第 一 行 , 阴性 结果 列 为 第 二 行 , 由 此 构成 了 一 个 四 格 表 。 


表 9-1 诊断 试验 评价 四 格 表 
诊断 试验 金 标准 诊断 方法 评估 结果 








合计 
病例 组 对 照 组 
小 a 真 阳性 5b 假 阳性 atb 
> < 假 阴 性 d 真 阴性 c+td 
合计 atc b+td V 


A in Ce 


4: 真 阳 性 , 为 病例 组 内 试验 阳性 的 例 数 ;0: 假 阳性 , 为 对 照 组 内 试验 阳性 的 例 数 ; c: 假 明 
性 , 为 病例 组 内 试验 阴性 的 例 数 ; q: 真 阴性 , 为 对 照 组 内 试验 阴性 例 数 ; N: 总 人 数 。 

各 项 评价 指标 的 计算 公式 : 

敏感 度 =a/(a+c); 特异 度 =q/(b+q); 准确 度 =(a+q)/N; 患 病 率 =(a+c)/N; 
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阳性 预测 值 : a/(a+5); 阴性 预测 值 : di(c+ad); 
阳性 似 然 比 :[ a/(a+e)]/[b/(b+q)]; 阴性 似 然 比 :[c/(a+e)]/[d(b+q) J 
四 、 盲 法 比较 诊断 试验 结果 

在 合理 选择 金 标 准 的 同时 ， 应 使 用 讶 法 独立 评价 诊断 试验 和 金 标准 的 诊断 结果 。 即 评价 者 
事先 无 法 获知 研究 对 象 的 具体 分 组 情况 , 是 “有 病 ” 组 还 是 “无 病 ” 组 ， 同时 评价 同一 病人 的 诊断 
试验 与 金 标 准 结果 也 是 独立 进行 的 。 这 里 有 三 层 意 义 : 一 是 准确 性 验证 ， 无 论 待 评 的 诊断 试验 
或 者 金 标 准 诊断 ， 都 需要 确定 其 结果 判定 的 准确 性 或 者 稳定 性 ， 至 少 应 有 2 个 独立 专家 进行 评 
价 , 结果 不 一 致 时 , 再 通过 第 三 位 专家 或 者 讨论 确定 。 二 是 独立 性 ， 即 诊断 试验 和 金 标准 诊断 
是 独立 进行 的 、 互 不 干扰 ， 顺序 先后 或 者 时 间 间 隔 也 不 会 对 结果 判断 产生 影响 。 三 是 盲 法 比较 ， 
即 对 诊断 试验 和 金 标准 诊断 结果 的 判 断 也 是 相互 独立 的 , 在 某 些 情况 下 ， 若 获 知 了 金 标准 结果 ， 
会 影响 甚至 左右 对 诊断 试验 结果 的 判断 。 例 如 ， 评价 者 先 在 患者 CT 片上 看 到 了 肺 部 结 节 , 在 读 
X 线 胸 片 时 , 会 先入为主 , 读 片 会 更 加 仔细 ， 甚至 发 现 以 前 读 片 时 并 没有 发 现 的 小 阴影 , 导致 测 
量 偏 倚 。 


第 三 节 诊断 试验 的 评价 指标 及 其 临床 应 用 





评价 诊断 试验 的 临床 价值 应 从 三 方面 考虑 : 真实 性 、 精确 性 和 适用 性 , 其 中 以 诊断 试验 本 
身 的 真实 性 大 小 最 为 重要 ， 下 列 一 些 指标 可 用 来 评价 诊断 试验 的 真实 性 。 


一 、 敏 感度 与 特异 度 


敏感 度 (sensitivity ), 又 称 灵敏 度 ， 是 指 由 标准 诊断 法 确诊 有 该 病 的 病例 组 中 经 诊断 试验 查 
出 阳性 人 数 的 比例 [a/(a+c)j] 而 病例 组 中 诊断 试验 结果 为 阴性 的 即 为 假 阴 性 患者 ， 占 病例 组 
的 比率 就 是 假 阴性 率 又 称 漏诊 率 , 敏感 度 和 假 阴性 率 是 互补 的 ， 即 敏感 度 = 1 一 假 阴 性 率 。 特 
异 度 (specificity ) 是 指 由 标准 诊断 法 确诊 无 病 的 对 照 组 中 经 诊断 试验 检 出 阴性 结果 人 数 的 比例 
[d/(b+4)]。 而 对 照 组 中 试验 结果 为 阳性 者 即 为 假 阳性 ， 假 阳性 例 数 占 对 照 组 的 比率 就 是 假 阳 
性 率 又 称 误诊 率 , 特异 度 和 假 阳 性 率 也 是 互补 的 , 即 特异 度 =1 一 假 阳性 率 。 

敏感 度 和 特异 度 都 为 100% 的 诊断 试验 最 为 理想 ， 即 没有 假 阳性 和 假 阴 性 出 现 , 有 病 组 和 
无 病 组 中 结果 数据 分 布 曲线 没有 重 释 (图 9-1a)， 这 在 临床 实践 中 往往 难以 实现 , 多 数 诊 断 试 验 
结果 的 分 布 曲线 是 两 组 有 部 分 重症 (图 9-1b)。 因 此 ， 诊断 试验 结果 若 为 连续 性 变量 时 ( 如 空腹 
血糖 和 血压 等 ), 区 分 正常 (阴性 )、 异 常 (阳性 ) 的 临界 点 (cut-off point ) 划 分 很 关键 , 将 直接 影响 
敏感 度 和 特异 度 , 如 选择 A 点 (图 9-1b), 该 试验 的 特异 度 为 98%, 但 敏感 度 仅 为 60%， 造成 许多 
病人 漏诊 ; 若 要 提高 敏感 度 , 可 将 临界 点 移 向 C 点 , 敏感 度 可 达 95%, 但 特异 度 降低 为 60%， 又 
造成 许多 误诊 病例 。 因 此 敏感 度 和 特异 度 一 般 呈 反比 关系 。 临 床 实践 中 可 通过 以 下 途径 选择 
临界 点 : 第 一 ， 可 利用 受 试 者 工作 特性 曲线 (receiver operator characteristic curve， ROC 曲线 ) 寻 找 
合适 的 临界 点 , 以 避免 过 多 的 假 阳 性 和 假 阴 性 ; 第 二 , 根据 临床 需要 ， 通过 权衡 假 阳性 和 假 阴性 
造成 的 后 果 , 选择 临界 点 , 以 达到 临床 需要 的 高 敏感 度 或 者 高 特异 度 。 高 敏感 度 试验 适用 于 : 
QO 疾病 严重 但 又 是 可 治疗 的 ,疾病 的 早期 诊断 将 有 益 于 病人 ， 而 疾病 漏诊 可 能 造成 严重 后 果 者 ， 
例如 结核 病 , 霍 奇 金 病 等 ; @D 有 几 个 诊断 假设 , 为 了 排除 某 病 的 诊断 ; 图 用 于 得 检 无 症状 病人 而 
该 病 的 发 病 率 又 比较 低 , 因此 当 试 验 结果 呈 阴 性 时 ,高 敏感 度 试验 的 临床 价值 最 大 。 高 特异 度 
试验 适用 于 : @ 凡 假 阳 性 结果 会 导致 病人 精神 和 肉体 上 严重 危害 时 , 例如 诊断 病人 患 癌 ， 而 准 
备 实 施 化 疗 ; @ 要 肯定 诊断 时 ,高 特异 度 试验 阳性 结果 的 临床 价值 最 大 。 
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例 数 0 








% 无 病 


例 数 0 





% 有 病 





试验 结果 一 一 一 
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图 9-1 敏感 度 和 特异 度 的 关系 


二 .准确 度 
准确 度 (accuracy ) 又 称 总 符合 率 、 粗 _ 致 性 (orude agreement rate), 表示 观察 值 与 标准 值 或 
真实 值 符合 的 程度 。 作为 诊断 试验 的 评价 指标 , 它 是 真 阳性 与 真 阴性 之 和 占 受 检 总 人 数 的 百 分 
率 ， 反映 正确 区 分 患者 与 非 患者 的 能 力 ,准确 度 高 则 真实 性 好 。 


三 、 预 测 值 与 患 病 率 

在 临床 实践 中 临床 医师 和 病人 都 会 关心 诊断 试验 的 诊断 价值 ， 如 是 阳性 结果 , 患 某 病 的 可 
能 性 有 和 多少, 阴性 结果 时 确 未 患 病 的 可 能 性 又 有 多 少 , 这 就 涉及 预测 值 (predictive value, PV) 
门 题 。 阳 性 预测 值 (positive PV ) 是 指 试 验 阳性 结果 中 真 患 该 病 的 比例 [a/(a+5)], 阴性 预测 值 
《negative PV ) 是 指 试验 阴性 结果 中 确 未 串 病 的 比例 [ d/(c+d)]。 一 般 说 来 , 越 灵敏 的 试验 , 其 了 
性 预测 值 越 高 ; 反之 特异 度 越 高 的 试验 , 其 阴性 预测 信 越 高 。 预 测 值 的 高 低 并 不 完全 取决 于 试 
验 本 身 ， 还 与 患 病 率 [(a+c)/(a+b+c+q)] 有 关 。 不 同 临床 情况 下 , 患 病 率 有 时 相差 甚大 。 例 
如 , AFP 诊断 肝癌 试验 车 在 某 三 级 医院 消化 科 应 用 ， 该 诊断 试验 的 敏感 度 和 特异 度 分 别 为 80% 
和 90%。 如 果 在 研究 人 群 为 肝 硬 化 患者 中 进行 ,肝癌 趾 病 率 大 致 为 50%, 见 表 9-2, AFP 诊断 肝 
瘤 阳性 预测 值 为 80/(80+ 10)=88.9%; 如 果 在 慢性 乙 型 肝炎 人 群 应 用 此 诊断 试验 ,人群 中 的 肝 
癌 患 病 率 小 于 10%( 假 设 为 9.1%), 表 9-3 显示 , 阳性 预测 值 为 44.4%; 如 果 在 携带 乙肝 病毒 人 
群 中 应 用 该 诊断 试验 , 此 时 的 人 群 患 病 率 不 足 1%( 假 设 为 0.99%), 表 9-4 显示 , 阳性 预测 值 为 
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7.4%; 如 果 将 AFP 作为 肝癌 高 发 区 普通 人 群 (肝癌 患 病 率 100/10 万 人 ， 0.1%) 的 第 查 , 表 9-5 显 
示 , 阳性 预测 值 降 至 0.8%。 由 此 可 见 , 患 病 率 对 预测 信 有 着 非常 重要 的 影响 。 因此 , 在 应 用 或 
者 引用 文献 报道 的 诊断 试验 时 ,应 考虑 其 患 病 率 是 否 与 本 医院 或 者 当地 情况 相似 ， 在 三 级 医院 
阳性 预测 值 很 高 的 试验 , 可 能 在 一 级 医院 就 很 低 。 


表 9-2 AFP 诊 断 肝癌 的 临床 研究 评价 ( 人 群 患 病 率 50% ) 








金 标准 评价 最 终结 果 
肝癌 非 肝 癌 
AFP(+) 80( 80%) 10(10% ) 
AFP(—) 20(20%) 90(90%) 





合计 100 0 


人 群 患 病 率 =100/(100+100)=50%, 敏感 度 =80%, 特异 度 =90%， 则 : 阳性 预测 值 = 80/ 
(80+10)= 88.9%, 阴性 预测 值 =90/(20+90)=81.8%。 


表 9-3 ”AFP 诊断 肝癌 的 临床 研究 评价 ( 人 群 患 病 率 9.1% ) 











金 标 准 评价 最 终结 果 
肝癌 非 肝癌 
AFP(+) 80(80% ) 100( 10%) 
AFP( 一 ) 20(20%) 900(90%) 
次 计 100 1000 





人 和 群 患 病 率 =100/(100+1000)=9.1%; 敏感 度 =80%, 特异 度 =90%, 则 : 阳性 预测 值 = 80/ 
(80+100)=44.4%, 阴性 预测 值 =900/(20+900)=97.8%。 


表 9-4 AFP 诊 断 肝 癌 的 临床 研究 评价 (人 群 患 病 率 0.99% ) 














金 标准 评价 最 终结 果 
肝癌 非 肝 癌 
AFP(+) 80( 80% ) 1000( 10% ) 
AFP(-—) 20(20%) 9000( 90% ) 
合计 100 10000 


ee 


人 了 群 患 病 率 = 100/(100+10000)=0.99%; 敏感 度 =80%, 特异 度 =90%; 则 : 阳性 预测 值 = 
80/(80+ 1000)=7.4%, 明 性 预测 值 =9000/(20+9000)=99.8%。 


表 9-5 AFP 诊 断 肝癌 的 临床 研究 评价 ( 人群 患 病 率 0.1% ) 











金 标 准 评价 最 终结 果 
肝癌 非 肝 瘤 
AFP(+) 80(80% ) 10000(10% ) 
AFP(—) 20(20%) 90 000( 90% ) 
合计 100 100000 








人 群 患 病 率 =100/( 100+10000)=0.1%; 敏感 度 =80%, 特异 度 =90%; 则 : 阳性 预测 值 = 
80/(80+10 000)=0.8%, 阴性 预测 值 =90000/(20+90000)=99.98%。 
由 此 可 见 , 由 于 受 患 病 率 的 影响 , 即使 试验 的 特异 度 很 高 , 当 用 于 患 病 率 很 低 的 人 群 时 , 仍 
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会 出 现 大 量 假 阳 性 病人 ; 同样 , 一 种 高 敏感 度 试验 , 当 用 于 上 患 病 率 很 高 的 人 群 , 仍 会 出 现 大 量 假 
阴性 病人 。 这 就 可 以 解释 为 什么 一 项 初评 诊断 价值 较 高 的 诊断 试验 ,用 于 普查 时 效果 并 不 佳 ， 
主要 是 由 于 患 病 率 相差 过 大 所 致 。 阳 性 预测 值 与 敏感 度 、 特 异 度 及 患 病 率 之 间 的 关系 , 可 用 
Bayes 公式 表示 : 








ee 患 病 率 x 敏感 度 
咀 性 预测 值 ” 十 病 率 大 感 度 +(I 二 上 患 病 率 )I 二 特异 度 ) 


四 . 似 然 比 


似 然 比 (likelihood ratio, LR) 也 是 可 以 同时 反映 敏感 度 和 特异 度 的 复合 指标 , 即 有 病 者 得 出 
某 一 试验 结果 的 概率 与 无 病 者 得 出 这 一 结果 可 能 性 的 比值 。 既 可 计算 连续 性 测 基 值 不 同 区 间 
的 LR, 又 可 避免 简单 地 将 试验 结果 划分 为 正常 和 异常 , 从 而 能 全 面 反映 诊断 试验 的 诊断 价值 ; 
同时 似 然 比比 敏感 度 和 特异 度 更 稳定 , 且 不 受 患 病 率 的 影响 , 但 不 足 之 处 在 于 该 指标 是 比 而 不 
是 率 , 应 用 时 需要 在 比值 与 率 之 间 进 行 换算 。 

阳性 似 然 比 系 真 阳性 率 和 假 阳性 率 之 比 , 一 项 诊断 试验 的 阳性 似 然 比 为 10, 意味 着 当 诊断 
试验 结果 为 阳性 时 , 判定 患 病 的 可 能 性 是 不 患 病 可 能 性 的 10 倍 。 阴 性 似 然 比 系 假 阴 性 率 和 真 
阴性 率 之 比 , 若 一 项 诊断 试验 的 阴性 似 然 比 为 0.01, 意味 着 当 诊 断 试验 结果 为 阴性 时 , 判定 患 病 
的 可 能 性 仅 为 不 患 病 的 1100。 因 此 , 为 肯定 诊断 之 目的 , 应 选择 高 阳性 似 然 比 的 诊断 试验 ,为 
排除 某 项 诊断 , 则 应 选择 阴性 似 然 比 更 低 的 诊断 试验 。 

似 然 比 的 应 用 步骤 包括 : 先 通过 文献 资料 估计 当前 患者 的 验 前 概率 , 最 初 的 验 前 爸 率 常常 
是 具有 某 一 临床 特征 (年 龄 、 性别. 人 群 特征 ) 的 人 群 患 病 率 , 计算 验 前 比 [ 验 前 比 = 验 前 概率 / 
(1 一 验 前 概率 ) ]; 确定 待 选择 的 诊断 试验 的 敏感 度 、 特 异 度 和 似 然 比 ; 再 按照 诊断 试验 结果 阳性 
或 者 阴性 估计 验 后 比 [ 验 后 比 = 验 前 比 x 似 然 比 ], 最 终 得 到 验 后 概率 [ 验 后 概率 = 验 后 比 作 1+ 
验 后 比 )]。 在 连续 进行 多 个 诊断 试验 时 ,前 一 个 试验 的 验 后 概率 或 者 验 后 比 就 作为 后 一 个 试验 
的 验 前 概率 或 者 验 前 比 。 

例如 : 通过 查阅 文献 获得 中 国人 和 群 乙肝 患者 40 岁 年 龄 段 肝癌 的 患 病 率 为 1%。 一例 40 岁 
有 慢性 乙肝 病史 的 男性 患者 , 前 来 就 诊 。 如 果 患 者 检查 发 现 AFP 阳性 (AFP 诊断 肝癌 试验 的 敏 
感度 和 特异 度 分 别 为 80% 和 90%), 阳性 结果 的 似 然 比 为 80%/10%=8, 再 按 1% 的 验 前 概率 ， 
计算 验 前 比 为 1/99, 验 后 比 为 8/99, 进而 该 患者 的 验 后 概率 为 8%, 即 通过 AFP 检查 阳性 这 一 结 
果 , 患 者 肝癌 的 可 能 性 从 1% 提高 到 8%。 

若 对 该 患者 进一步 进行 肝脏 彩超 检查 , 彩超 检查 结果 也 是 阳性 (发 现 肝 占 位 并 且 考 虑 肝 瘤 )， 
文献 报告 彩超 诊断 肝癌 的 敏感 度 和 特异 度 都 达到 80% 和 80%, 阳性 结果 似 然 比 为 80%/20% =4。 
该 患者 的 验 前 概率 =8%, 验 前 比 =8/99, 则 验 后 比率 =(8/99)x4(B 型 彩超 阳性 )= 0.323, 验 后 概 
率 =0.323/(1+0.323)x 100%=24.4%, 则 患者 肝癌 的 可 能 性 从 8% 提高 到 24.4%。 

若 假 设 不 进行 彩超 检查 , 而 让 患者 直接 接受 增强 CT 检查 ,检查 结果 也 是 阳性 , 即 CT 判断 为 
肝癌 ,该 患者 肝癌 可 能 性 有 和 多少 呢 ? 文献 报告 增强 CT 诊断 肝癌 的 敏感 度 为 90%, 特异 度 为 77%， 
阳性 结果 似 然 比 为 90%/(1 -77%)=3.9, 验 前 概率 =8%, 验 前 比 = 8/99, 验 后 比率 =( 8/99 )x 3.9 
(增强 CT 阳性)=0.315, 那么 验 后 概率 =0.315/(1+0.315)x100%=24.0%。 

再 假如 , 增强 CT 检查 是 在 彩超 之 后 进行 ,增强 CT 检查 为 阳性 , 该 患者 患 该 癌 的 可 能 性 升 
高 到 多 少 呢 ?此 时 的 验 前 比 为 彩超 检查 之 后 的 验 后 比 (0.323), 而 验 后 比 为 0.323 x 3.9 = 1.261， 
验 后 概率 为 1.261/(1+1.261)x 100%=55.8%, 即 该 患者 趴 患 肝 癌 的 可 能 性 由 24.4% 提高 到 55.8%。 

因此 , 在 1% 肝癌 患 病 率 基础 上 ,增加 AFP 阳性 (阳性 似 然 比 =8)、 彩 超 阳性 (阳性 似 然 比 =4\ 
增强 CT 阳性 (阳性 似 然 比 =3.9), 患者 肝癌 患 病 率 提高 到 55.8%, 如 下 计算 过 程 : 
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验 前 比 = 1/99, 验 后 比 =(1/99)x8(AFP 阳性 比 )x4(B 型 彩超 阳性 )x 3.9(CT 阳性 )=1.261， 
则 : 验 后 概率 =1.261/(1+1.261)x100%=55.8%。 

在 应 用 似 然 比 时 还 要 注意 以 下 问题 : 

(1) 基础 患 病 率 不 同 , 诊断 试验 效率 不 同 。 假 如 该 患者 不 仅 为 慢性 乙 型 肝炎 , 影像 学 及 其 他 
检查 还 发 现 患者 已 存在 早期 肝 硬 化 , 其 基础 肝癌 患 病 率 将 从 1% 提高 到 10%, 若 系列 检查 结果 显 
示 AFP 阳性 、B 超 阳性 .增强 CT 阳性 , 那么 该 患者 肝癌 的 可 
能 性 将 达到 93.3%。 具 体 计算 过 程 : 验 前 概率 =10%, 验 前 
比 =10/90, 验 后 比率 =(10/90)x8(AFP 阳性 比 )x4(B 型 彩超 
阳性 )x 3.9( CT 阳性 )=13.9, 则 验 后 概率 =13.9/(1+13.9)x 
100% = 93.3%。 

不 同人 群 的 基础 患 病 率 不 同 , 运用 诊断 试验 得 到 的 似 然 
比 不 同 , 由 此 估计 的 验 后 概率 也 不 同 。 临 床上 , 确诊 疾病 需 
要 寻找 更 多 阳性 诊断 依据 , 而 否定 诊断 则 需要 更 多 阴性 结果 
支持 。 

(2) 应 用 似 然 比 应 用 图 直接 查找 验 后 概率 。 如 果 事 先 测 
出 一 些 诊断 试验 的 似 然 比 , 依据 文献 资料 获得 人 群 的 患 病 概 
率 ( 验 前 概率 ), 通过 计算 可 推断 患者 检查 后 患 某 病 的 概率 增 
加 或 减少 了 多 少 , 有 助 于 作出 正确 的 诊断 。 除 了 运用 上 述 公 
式 进 行 计算 外 ,还 可 利用 似 然 比 应 用 图 (Fagan*s nomogram ) 
(图 9-2), 将 直 尺 的 一 端 放 在 验 前 概率 对 应 点 ,再 与 该 试验 似 
然 比 所 在 点 对 齐 , 直 尺 另 一 端 所 指 就 是 验 后 概率 , 此 方法 方 

















便 易 行 , 临床 实用 性 强 。 十 吧 
(3 ) 当 诊 断 试验 结果 为 二 分 类 变量 时 , 可 计算 单个 阳性 402 








或 阴性 似 然 比 ; 但 当 试 验 结果 为 连续 性 变量 时 , 应 分 别 计算 : bi 
不 同 区 间 对 应 的 似 然 比 。 如 试验 结果 范围 是 从 0 到 100, 则 验 前 概率 ” 似 然 比 。 ” 验 后 概率 
可 分 别 计算 诸如 LR(0~10)、LR(11~20)、…、LR(91~100) 时 图 9-2 似 然 比 应 用 图 
的 似 然 比 。 如 : 





病人 试验 结果 在 11~20 范围 内 所 占 概率 


LR(11~20)= 
无 病 组 试验 结果 在 11~20 范围 内 所 占 概率 





当 试 验 测定 结果 为 连续 性 变量 时 , 诊断 试验 特征 的 最 好 表达 方式 是 似 然 比 , 而 不 是 常用 的 
敏感 度 和 特异 度 , 似 然 比 描述 诊断 试验 的 特征 更 为 全 面 。 


第 四 节 ” 受 试 者 工作 特性 曲线 


前 面 所 列 的 阳 ( 阴 ) 性 似 然 比 、 阳 ( 阴 ) 性 预测 值 等 指标 综合 利用 了 敏感 度 与 特异 度 的 信息 ， 
但 这 些 指标 都 与 诊断 界 点 (或 阔 值 ) 的 选取 有 关 。 同 一 诊断 试验 , 不 同 的 诊断 界 点 就 对 应 着 不 同 
的 敏感 度 和 特异 度 。 为 全 面 评价 检测 方法 的 诊断 价值 , 应 分 别 计 算 不 同 诊断 临界 点 下 的 敏感 度 
和 特异 度 。 

受 试 者 工作 特性 曲线 (receiver operator characteristic curve, ROC 曲线 )， 又 称 受 试 者 工作 
特征 曲线 , 是 以 敏感 度 为 纵 坐 标 、 以 假 阳性 率 (1 特异 度 ) 为 横 坐 标 绘制 而 成 的 曲线 (图 9-3 )。 
可 以 进一步 计算 与 比较 ROC 曲线 下 面积 , 以 综合 反映 诊断 试验 的 诊断 价值 。ROC 曲线 可 以 
用 来 
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< 敏感 度 : 81.8% 本 
和 特异 度 : 83.5% ,好 
起 ,站 
备 Bs 
六 40 Oy 
20 we 
曲线 下 面积 : 0.888 ( 0.852~0.917 ) 
-一 一 -一 一 :一 
0 20 80 100 


40 60 
1- 特 异 度 (% ) 
图 9-3 ” AFP 诊断 肝癌 ROC 曲线 


一 、 确 定 诊断 试验 的 参考 值 
ROC 曲线 (图 9-4) 常 被 用 来 决定 最 佳 临界 点 , 如 患 病 率 接近 50% 左右 时 , 最 接近 左上 角 那 
一 点 ,可 定 为 最 佳 临界 点 。 如 患 病 率 极 低 或 甚 高 , 其 最 佳 临界 点 可 不 在 最 接近 左上 角 那 一 点 。 
注意 : 仅 靠 一 两 次 试验 难以 找到 一 个 敏感 度 和 特异 度 俱 佳 的 临界 点 。 
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图 9-4 ROC 曲线 


二 、 不 同 试验 诊断 价值 的 比较 

ROC 曲线 是 一 种 全 面 ,准确 评价 诊断 试验 的 有 效 方法 , 可 用 来 比较 两 种 或 多 种 诊断 试验 的 
诊断 价值 , 从 而 帮助 临床 医师 正确 选用 诊断 试验 。 图 9-5 中 可 以 看 到 特异 度 相同 的 情况 下 , 血 
清心 肌 酶 CK 诊断 心肌 梗死 的 敏感 度 高 于 心电图 ST 段 改变 水 平 的 诊断 效果 。 

除了 上 述 目测 方法 外 , 还 可 计算 ROC 曲线 下 的 面积 (area under the ROC curve, AUC ), 来 定 
量 比较 几 种 诊断 试验 的 诊断 效率 , AUC 越 大 , 越 接近 1.0, 其 诊断 价值 越 高 , AUC 越 接近 0.5, 则 
诊断 价值 越 低 。AUC 的 计算 原理 是 将 曲线 下 的 面积 分 成 多 个 梯形 , 计算 每 个 梯形 面积 , 最 后 将 
多 个 梯形 面积 相 加 求 和 , 即 为 AUC, 亦 可 借助 于 计算 机 软件 计算 。 

ROC 曲线 具有 如 下 优点 : GT 方法 简单 直观, 通过 目测 就 可 判断 和 比较 诊断 价值 ; @ 可 综合 
反映 敏感 度 和 特异 度 的 相互 变化 关系 ; @ ROC 曲线 评价 与 基础 患 病 率 无 关 。 但 ROC 曲线 同样 
存在 一 定 的 局 限 性 : 即 ROC 曲线 上 所 显示 的 不 完全 是 真正 的 判断 值 。 
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图 9-5 ”血清 心肌 酶 CK 水 平和 EKG( ST 段 改变 水 平 ) 诊 断 心 梗 ROC 曲线 比较 


一 、 参 考 值 的 概念 


医学 上 对 参考 值 范围 的 传统 概念 , 指 的 是 正常 人 解剖 、 生 理 、 生 化 等 各 种 数据 的 波动 范围 。 
这 些 数 据 不 仅 因 人 而 异 , 即使 同一 个 人 , 还 会 因 机 体内 外 环境 的 变化 而 变化 , 因此 需要 有 一 个 
正常 波动 范围 。 传 统 的 认识 主要 是 基于 临床 实践 , 着 眼 于 个 体 , 作为 划分 “正常 "与 “异常 ”的 界 
限 。 随 着 现代 医学 的 发 展 , 对 参考 值 的 概念 也 有 了 进一步 认识 , 如 预防 医学 实践 着 眼 于 群体 , 制 
定 不 同性 别 、 年 龄 儿童 发 育 评 价 标准 , 制定 食品 、 水 、 空 气 的 卫生 标准 及 有 害 物质 的 允许 浓度 , 作 
为 保护 健康 的 安全 界限 。 这 样 对 参考 值 的 含义 就 超过 了 上 述 狭义 的 参考 值 , 因而 可 称 为 广义 的 
参考 值 。 




















二 、 确 定 参考 值 的 基本 方法 


制定 参考 值 , 常 以 “正常 人 "为 对 象 , 这 与 医学 上 的 健康 含义 不 同 , 所 谓 “ 正 常人 "不 是 指 机 
体 任何 器 官 组织 的 形态 及 功能 都 正常 的 人 , 而 是 排除 了 影响 所 研究 指标 的 疾病 和 有 关 因素 后 ， 
所 确定 的 同 质 人 群 。 确 定 参考 值 的 基本 方法 如 下 ， 

(一 ) 均 数 加 减 标准 差 倍数 法 

目前 在 临床 上 或 文献 上 大 多 采用 “区 数 二 2 倍 标准 差 (8)” 作为 参考 值 的 范围 , 凡 超出 此 范 
围 的 、 无 论 过 高 或 过 低 均 视 为 异常 。 采 用 这 种 方法 确定 参考 值 的 前 提 条 件 是 诊断 试验 的 数据 满 
足 正 态 分 布 。 如 有 些 资料 不 呈正 态 分 布 , 可 作对 数 转 换 变 成 正 态 分 布 后 , 再 计算 参考 值 范围 。 
车 转换 后 仍 不 满足 正 态 分 布 ,可 采用 百 分 位 数 法 。 

(二 ) 百 分 位 数 法 

由 于 多 数 诊断 试验 测定 值 的 频数 分 布 并 非 正 态 , 因此 有 人 主张 用 百 分 位 数 确定 “正常 ”和 
“异常 "的 界限 。 若 诊断 指标 过 高 或 过 低 均 认为 不 正常 ,可 采用 双 侧 范围 法 , 确定 第 2.5 百 分 位 
数 (P,s) 到 第 97.5 百 分 位 数 ( Pws) 的 区 间 为 参考 值 范围 ; 若 数值 过 小 为 不 正常 , 则 参考 值 下 限定 
在 第 5 百 分 位 数 (P;); 若 数值 过 大 为 不 正常 , 则 参考 值 上 限定 在 第 95 百 分 位 数 (Pss)。 采 用 百 
分 位 数 制定 参考 值 范围 时 ,样本 量 要 足够 , 否则 误差 比较 大 , 有 人 建议 观察 例 数 至 少 应 在 120 例 
Es 














EE 
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(三 ) 应 用 受 试 者 工作 特性 曲线 法 制定 正常 参考 信 
ROC 自 线 是 用 敏感 度 为 纵 坐标 , 假 阳性 率 (1_ 特异 度 ) 为 模 坐 标 作 图 所 得 的 时 线 , 也 可 用 
来 确定 最 佳 临界 值 。 将 曲线 上 最 接近 左上 角 的 


点 作为 区 别 正常 异常 的 界限 , 作为 制定 正常 参 

考 值 的 依据 。 

(四 ) 从 临床 实际 出 发 制定 正常 参考 信 

临床 上 ， 一 个 诊断 试验 的 测定 值 达到 什么 水 平 ， 才 需 要 治疗 ,党 基于 人 群 调查 结果 进行 人 
全 判断。 例如, 血清 胆固醇 水 平 超过 6 5mmrnoyL 时 ,发生 冠 心病 的 危险 性 显著 升 高 ,而 低 于 此 水 
平 危险 就 不 明显 , 故 将 血清 胆固醇 水 平定 为 超过 6 5mmol/L 为 异常 。 

(五 ) 影响 正常 参考 值 的 各 种 因素 

研究 对 象 的 选择 、 研 究 对 象 的 生理 因素 和 环境 因素 .技术 操作 和 仪器 设备 因素 的 影响 、 统 
计 处 理 问题 都 可 能 影响 设 定 正常 参考 值 的 准确 性 

此 外 ,多 项 指标 同时 运用 时 ,最 好 联合 建立 多 项 指标 的 参考 什 范 围 , 否 则 候 阳 性 率 会 很 高。 如 
使 用 1 项 指标 检测 的 异常 率 为 5%; 若 有 两 项 检测 , 则 10% 为 异常; 若 5 项 检验 则 23%[ 1 一 (0.95)*] 
的 个 体 为 异常 ,显然 不 合理 。 联 合 建立 多 项 指标 参考 值 范围 的 方法 可 参考 医学 统计 专著 。 


第 六 节 ”多 项 试验 的 联合 诊断 


鉴于 敏感 度 和 特异 度 俱 佳 的 诊断 试验 不 多 , 所 以 在 不 同 的 临床 诊断 需求 的 循 证 情况 下 ， 分 
别 采 取 多 项 诊断 试验 的 联合 应 用 ， 以 期 提高 循 证 诊断 水 平 。 


一 、 联 合 诊断 方式 

联合 方式 有 两 种 : 平行 试验 (parallel tests) 和 系列 试验 (serialtests )。 平 行 试验 指 的 是 几 个 诊 
断 试验 同时 进行 , 只 要 任 一 试验 结果 为 阳性 , 联合 诊断 结果 就 为 阳性 。 系列 试验 系 按照 一 定 硕 
订 依 次 进行 诊断 试验 , 只 有 所 有 试验 结果 均 为 阳性 者 ,联合 诊断 结果 方 为 阳性 。 因 此 平行 试验 
可 以 提高 敏感 度 和 阴性 预测 值 ,而 系列 试验 相反 , 提高 的 是 特异 度 和 阳性 预测 值 。 

(一 ) 平行 试验 

于 行 试验 又 称 并 联 试验 , 适用 于 下 列 情况 : D 对 于 住院 或 急症 病人 或 外 地 的 门诊 病人 复诊 
有 困难 时 , 需要 迅速 作出 诊断 。 @ 为 避免 漏诊 ,但 手中 只 有 两 项 或 两 项 以 上 不 太 录 做 的 试验 时 ， 
组 合成 平行 试验 特别 有 用 。 需 要 注意 的 是 : 平行 试验 在 提高 了 敏感 谍 和 阴性 预测 值 的 同时 , 特 
蜡 度 与 阳性 预测 值 会 降低 , 导致 假 阳性 诊断 增加 。 

(二 ) 系列 试验 

系列 试验 又 称 串联 试验 , 适用 于 下 列 情况 : 为 避免 误诊 情况 的 发 生 , 可 考虑 使 用 系列 试 
验 ” 包 当 基 些 试验 昂贵 且 有 危险 性 时 ,可 用 较 简单 安全 的 试验 先 做 , 一 且 提 示 该 病 可 能 存在 之 
后 , 才 使 用 这 些 试验 。 如 先后 使 用 两 种 试验 诊断 疾病 , 若 其 余 条 件 均 相同 , 应 首先 使 用 特异 度 
高 的 试验 使 较 少 的 病人 暴露 于 第 二 种 试验 (危险 性 高 ), 特别 是 该 项 试验 花费 少 而 又 无 危险 性 
时 ,更 应 先 用 。 国 当 单项 试验 的 特异 度 普遍 不 高 时 , 系列 试验 也 特别 有 用 。 

意 的 是 : 系列 试验 可 提高 特异 度 和 阳性 预测 值 , 试验 阳性 者 表明 目 病 更 为 可 信 , 但 

同时 降低 了 敏感 度 和 阴性 预测 值 , 漏诊 的 可 能 性 增加 。 


二 、 独 立 性 与 联合 试验 的 做 感度 和 特异 度 
独立 性 是 计算 联合 试验 敏感 度 和 特异 度 的 前 提 条 件 : 即 诊断 试验 之 问 是 互相 独立 的 ,诊断 


手段 和 结果 相互 间 没 有 影响 , 或 者 诊断 试验 的 原理 截然 不 同 。 如 诊断 肝癌 所 用 的 血清 学 检查 
AFP 和 影像 学 检查 增强 CT, 两 者 诊断 原理 不 同 ,就 满足 独立 性 。 同 样 , 冠 心病 的 诊断 , 心电图 、 
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运动 试验 等 反映 心肌 缺 血 程度 , CTA、 冠 脉 造影 反映 冠状 动脉 解剖 上 的 变化 ， 诊断 试验 间 的 互相 
影响 也 很 小 ; 而 两 种 影像 学 检查 如 CT 和 磁 共振 ,都 从 占 位 的 角度 诊断 , CT 出 现 占 位 一 般 磁 共 
振 也 可 以 发 现 占 位 ,两 者 结果 就 存在 一 定 关联 。 

假设 A 试验 和 B 试验 为 两 个 独立 的 试验 , 其 敏感 度 分 别 为 0.8 和 0.9, 特异 度 依次 为 0.6 和 
0.9, 并 假设 患 病 率 为 20%。 联合 试验 敏感 度 和 特异 度 的 计算 方法 如 下 : 

(1) 系列 试验 方式 : 即 两 者 均 阳 性 才 算 阳 性 结果 。 假 定 先 做 A 试验 , A 试验 阳性 者 再 做 B 试 
验 。 两 者 均 阳 性 的 144 例 为 阳性 结果 , 占 总 病例 数 200 的 72%。 即 联合 敏感 度 是 72%。 试验 阴 
性 者 为 480+288==768, 占 总 阴性 人 数 800 的 96%, 即 联合 特异 度 为 96%。 由 此 可 见 系列 试验 提 
高 了 特异 度 。 

(2) 平行 试验 方式 : 即 两 试验 中 一 个 阳性 就 作为 阳性 结果 。 为 估算 平行 试验 的 敏感 度 和 特 
异 度 , 先 做 A 试验 , A 试验 阴性 者 再 做 B 试验 。 将 B 试验 的 真 阳性 36 人 加 A 试验 的 真 阳性 160 
人 , 共 196 人 , 占 阳性 的 200 人 中 的 98%, 即 联 合 敏感 度 。 这 相当 于 假定 A 试验 和 B 试验 是 完全 
独立 的 , 它们 的 联合 敏感 度 为 0.8+0.9-(0.8x0.9)=0.98。 而 其 阴性 432 人 , 占 总 阴性 人 数 800 
的 54% , 即 联合 特异 度 。 由 此 可 见 平行 试验 增加 了 联合 敏感 度 。 








第 七 节 诊断 试验 结果 的 一 致 性 评价 


由 于 在 临床 实践 或 者 临 床 研究 中 , 测量 变异 (measurement variation ) 无 处 不 在 ， 它 可 来 自 观 
察 者 间 的 变异 , 观察 者 的 自身 变异 , 测量 仪器 、 试 剂 的 变异 及 研究 对 象 的 生物 学 变异 (个 体内 及 
个 体 间 ) 等 , 这 些 变异 往往 是 同时 存在 、 相 互 蕉 加 的 。 诊 断 试验 同样 如 此 ， 那么 一 项 诊断 试验 结 
果 是 否 可 靠 呢 ? 也 和 需要 进行 评价 。 诊 断 试 验 的 可 靠 性 (reliability )， 又 称 可 重复 性 (repeatability 2 
是 评价 诊断 试验 另 一 项 指标 。 重 复 性 是 指 诊断 试验 在 完全 相同 条 件 下 , 进行 重复 操作 获得 相同 
结果 的 稳定 程度 。 诊 断 试 验 结果 是 否 可 靠 , 需要 进行 一 致 性 评价 。 


一 、Kappa 值 及 其 意义 


Kappa 值 是 一 致 性 评价 的 常用 指标 , 用 于 判断 不 同 观察 者 间 观 察 结果 的 一 致 性 。Kappa 值 
的 意义 和 推理 举例 说 明 如 下 : 甲乙 两 位 临床 经 验 相似 的 医生 通过 阅读 相同 的 上 腹部 增强 CT 
片 诊断 肝癌 , 共 阅 读 100 张 CT 片 ,结果 表明 ,两 人 均 诊断 肝癌 48 例 , 两 人 均 诊 断 非 肝 瘤 38 例 ， 
观察 一 致 率 86%, 此 临床 意见 一 致 率 较 高 , 但 根据 一 般 常 识 , 任何 现象 都 存在 偶然 性 (机 遇 ) 和 
必然 性 ( 非 机 遇 ), 临床 观察 也 不 例外 , 假如 排除 了 机 遇 因 素 后 , 实际 一 致 率 如 何 呢 ? 实际 一 臻 
率 称 Kappa 值 。Kappa 值 的 计算 步骤 如 下 ( 表 9-6 ): 











表 9-6 甲乙 医生 阅读 同样 100 张 腹 部 增强 CT 诊断 肝癌 的 一 致 率 














甲 医生 
SE 肝 痪 非 肝癌 全 
肝癌 48(a) 6(b) 54(1m) 
韭 肝癌 8(c) 38(d) 46( 疡 ) 
合计 56(c1) 44(c,) 100(N) 


观察 一 致 率 (O4)=(a+d)/N=(48+38)/100=86%; 机 遇 一 致 率 ( £4)=(nxc)/IN+(r2xc2)/ 
N=54x 56/100+46x44/100=51%, 非 机 遇 一 致 率 =86%-51%=35%, 则 : Kappa 值 = 实际 一 至 
率 / 非 机 遇 一 致 率 =35%/49%=0.71。 

目前 对 判断 Kappa 值 的 意义 尚 有 争议 ,但 多 数 认为 Kappa 值 在 0.4~0.75 有 中 度 至 高 度 一 臻 
性 ,>0.75 时 ,一 致 性 好 ( 表 9-7)。 
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表 9-7 Kappa 值 判断 标准 








Kappa 值 一 致 性 强度 Kappa 值 一 致 性 强度 
<0 弱 0.41~0.60 中 度 
0~0.2 轻 0.61~0.80 高 度 
0.21~0.40 尚 可 0.81~1 最 强 





二 、 观 察 或 诊断 结果 的 一 致 性 评价 方法 
观察 结果 的 一 致 性 评价 方法 依据 数据 类 型 而 定 , 计量 资料 或 连续 性 变量 资料 采用 组 内 相 
关系 数 (intra-correlation coefficients, ICC ); 对 于 计数 资料 或 分 类 变量 资料 , 采用 观察 符合 率 与 
Kappa 值 表示 。 上 述 指标 大 于 0.7, 可 认为 一 致 性 较 好 。 


第 八 节 诊断 试验 的 评价 标准 


诊断 试验 研究 , 在 临床 应 用 之 前 ,尤其 是 用 于 自己 的 患者 诊断 时 ,需要 进行 科学 性 评价 。 
评价 的 原则 包括 试验 的 设计 是 否 合理 , 测试 手段 是 否 可 靠 , 是 否 避 免 了 偏 倚 , 然后 才能 对 定量 
指标 所 示 的 真实 性 和 可 靠 性 作出 精确 的 判断 。 
一 、 是 否 将 诊断 试验 与 标准 诊断 法 ( 金 标准 ) 进 行 了 宵 法 对 比 

这 是 评价 诊断 试验 最 核心 的 一 条 。 作 为 参照 的 金 标准 诊断 ,定义 是 否 清晰 明确 , 非常 关键。 
在 合理 选择 金 标准 的 同时 , 待 评 试验 必须 同 金 标准 诊断 进行 独立 的 讶 法 比较 。 即 要 求 试验 结果 
的 评价 者 预先 无 法 获知 哪些 病例 使 用 金 标准 判定 为 “有 病 ”哪些 判定 为 “无 病 ” 同一 病人 诊断 
试验 与 金 标准 诊断 结果 要 独立 进行 评价 。 


二 、 研 究 对 象 的 代表 性 如 何 

研究 人 群 应 包括 两 组 : 一 组 是 用 金 标准 确诊 “有 病 " 的 病例 组 , 另 一 组 是 用 金 标准 证 实 为 
“无 病 ” 的 对 照 组 。 病 例 组 应 包括 各 型 病例 : 如 典型 和 不 典型 , 早 、 中 与 晚期 病例 , 有 无 并 发 证 
等 , 以 便 使 诊断 试验 的 结果 更 具有 临床 应 用 的 价值 。 最 能 体现 诊断 试验 价值 的 是 区 分 有 病变 的 
早期 病人 和 易 与 该 病 混淆 (症状 、 体 征 相同 ) 的 其 他 疾病 。 因 此 ,诊断 试验 评价 应 该 纳入 那些 临 
床 实践 中 可 能 遇 到 的 各 种 病人 作为 病例 组 , 而 对 照 组 应 选用 金 标准 证 实 没 有 日 标 疾病 的 其 他 病 
例 , 特别 是 与 该 病 易 混淆 的 病例 , 以 明确 鉴别 诊断 的 价值 , 正常 人 一 般 不 宜 纳入 对 照 组 , 否则 会 
等 大 其 敏感 度 和 特异 度 。 终 未 期 病人 检查 时 , 试验 结果 常 有 明显 的 异常 ,因此 待 评 诊 断 试 验 很 
容易 将 晚期 病人 与 正常 人 区 分 开 来 。 典 型 的 例子 是 癌 胚 抗原 (CEA ) 对 结肠 癌 的 诊断 价值 。 最 
初 报 道中 ,36 例 晚 期 结肠 .直肠 癌 病 人 ,有 35 例 (97.2%) 的 CEA 升 高 , 对照 组 为 未 患 结肠 癌 的 
其 他 病人 , CEA 水 平 大 多 较 低 , 据 此 作者 认为 CEA 是 一 项 筛选 结肠 瘤 的 有 用 试验 。 而 之 后 将 诊 
断 试验 用 于 包括 早期 结肠 瘤 以 及 有 其 他 胃 肠 道 疾病 对 象 时 , 发 现 CEA 诊断 结肠 冶 的 效率 并 不 
高 , 也 不 能 将 早期 结肠 癌 病 人 与 其 他 胃 肠 病 病 人 鉴别 开 来 。 


三 、 样 本 量 是 否 足 够 
诊断 试验 中 样本 量 应 该 足够 。 过 少 ,样本 缺乏 代表 性 ; 过 大 又 增加 工作 量 和 研究 费用 。 
四 、 参 考 值 选 择 是 否 合理 
参考 值 或 截断 点 (cuiroff point ), 又 称 临界 值 (eritical value )， 它 的 选择 将 直接 影响 试验 的 敏 
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感度 和 特异 度 , 因此 , 应 交代 截断 点 的 选择 方法 并 进一步 说 明 其 合理 性 。 
五 、 是 否 同时 评价 了 真实 性 与 可 靠 性 


一 项 好 的 诊断 试验 , 应 该 是 既 真 实 又 可 靠 的 。 因 此 在 评价 时 , 不 仅 要 计算 反映 真实 性 的 指 
标 , 同时 还 要 计算 评价 可 靠 性 的 指标 , 两 者 缺 一 不 可 。 


六 、 是 否 交 代 了 诊断 试验 的 具体 步骤 


诊断 试验 方法 (包括 所 用 仪器 、 试 剂 、 设 备 、 实 验 条 件 等 ) 是 否 具体 详尽 , 操作 步骤 和 注意 事 
项 是 否 明确 , 以 便 他 人 学 习 或 验证 , 也 有 助 于 诊断 试验 在 临床 的 推广 和 普及 。 


七 、 联 合 试验 的 评价 


在 评价 联合 诊断 试验 的 诊断 价值 时 , 不 仅 要 计算 联合 试验 敏感 度 、 特 异 度 等 指标 , 各 个 单 
项 诊断 试验 的 评价 指标 也 要 一 并 报告 。 


八 . 控 制 偏 倚 


评价 一 项 诊断 试验 时 ,还 要 考虑 该 诊断 试验 是 否 排除 了 各 种 偏 倚 (选择 偏 倚 、 错 误 分 类 偏 
倚 、 测 量 偏 倚 等 ) 对 结果 的 影响 。 


九 、 临 床 意义 及 适用 性 
诊断 试验 经 过 效用 分 析 后 ,还 需 用 可 靠 的 依据 说 明 其 临床 意义 和 适用 性 , 包括 正确 判断 的 
收益 和 错误 判断 的 可 能 后 果 等 。 


第 九 节 ”证 据 的 临床 实践 及 案例 


实施 诊断 试验 时 , 首先 要 将 临床 实践 中 有 关 诊 断 试验 问题 用 一 个 可 以 回答 的 方式 加 以 构 
建 , 其 次 证 明 有 关 该 诊断 试验 正确 性 的 证 据 是 足够 可 信 的 , 然后 了 解 证 据 的 重要 价值 和 临床 意 
义 。 最 后 考虑 如 何 将 这 项 诊断 试验 用 于 当前 的 病人 。 具 体 实践 步骤 可 参照 表 9-8。 





表 9-8 有关 诊断 试验 的 循 证 医学 实践 步骤 
根据 临床 问题 (可 回答 的 特殊 临床 问题 ) 找 出 最 恰当 的 、 高 度 相关 的 研究 文献 
2. 评价 诊断 试验 的 科学 性 

QOD 试验 是 否 与 金 标准 试验 进行 了 独立 、“ 讶 法 "的 比较 
名 是 否 每 个 被 测 者 都 用 参照 试验 进行 评价 
@ 所 研究 病人 样本 是 否 包 括 临床 中 的 各 种 病人 
@ 诊 断 试验 的 精确 性 如 何 
3. 估计 临床 应 用 的 重要 性 
@ 佑 计 疾 病 的 验 前 概率 
@ 说 明和 评估 有 关 试 验 的 敏感 度 、 特 异 度 、 预 测 值 和 似 然 比 资料 
图 评估 应 用 该 试验 似 然 比 估计 的 期 望 结果 ( 验 后 概率 ) 
4 临床 研究 结果 是 否 适用 于 自己 的 病人 并 取得 预期 的 结果 
OD 结果 是 否 适用 于 我 自己 的 病人 
@ 诊 断 试 验 结果 是 否 改 变 了 对 患 病 率 的 估计 
国 诊断 试验 结果 是 稍 改 变 了 对 病人 的 处 理 




















笔记 
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一 、 疾 病案 例 和 提出 问题 


例如 : 一 位 35 岁 男性 病人 ,乙肝 病史 10 年 , 目前 检查 HBsAg(+), HBcAb(+), HBeAg(+)， 
ALT 正常 水 平 , HBV-DNA 检测 5 x 10?, 血清 透明 质 酸 (HA) 和 本 型 胶原 (PLP) 均 不 同 程度 升 高 ， 
临床 怀疑 患者 肝病 程度 已 进展 到 早期 肝 硬化 , 进一步 该 如 何 处 理 ? 

首先 基于 临床 案例 , 提出 一 个 可 回答 的 问题 , 将 问题 具体 化 。 如 根据 现 有 的 临床 指南 , 慢 
性 肝病 患者 接受 抗 病毒 治疗 的 标准 是 不 同 的 , 而 依据 目前 患者 的 资料 , 是 否 抗 病毒 治疗 取决 于 
是 否 进 入 明显 肝 纤 维 化 (F3 ) 或 者 肝 硬 化 (F4) 阶 段 。 因 此 当前 需要 解决 的 问题 是 : “患者 肝 纤 维 
化 进展 到 何 种 程度 ?通过 何 种 措施 可 以 帮助 我 们 进一步 明确 诊断 ”。 

根据 一 般 文 献 资 料 或 者 进展 文献 , 获知 肝 纤 维 化 的 金 标准 诊断 为 病理 诊断 , 临床 上 常用 肝 
穿刺 活检 病理 组 织 学 检查 来 明确 诊断 , 但 为 有 创 性 操作 , 尽管 目前 通过 超声 引导 穿刺 提高 了 安 
全 性 ,但 很 多 患者 仍 难以 接受 。 非 创伤 性 的 诊断 技术 则 成 为 研究 和 评价 热点 。 血 清 学 检查 尽管 
简便 , 但 临床 诊断 效率 不 高 。 近 年 来 开展 了 超声 弹性 成 像 、 磁 共振 弹性 成 像 在 肝 纤 维 化 诊断 中 
的 应 用 ,那么 我 们 将 选择 超声 弹性 成 像 还 是 磁 共振 弹性 成 像 呢 ? 

为 此 ,我 们 进一步 将 问题 具体 化 ,转换 为 三 个 可 回答 的 研究 问题 是 : 超声 弹性 成 像 诊 断 肝 
纤维 化 有 效 吗 ? 磁 共 振 弹 性 成 像 有 效 吗 ? 磁 共 振 弹 性 成 像 比 超声 弹性 成 像 更 好 吗 ? 


二 、 检 索 相关 文献 资料 


| 文献 检索 通常 分 三 大 步 : 第 一 , 选择 医学 文献 数据 库 ， 如 最 为 常用 的 PubMed(www.pubmed. 
com)、UpToDate 或 Ovid 等 。 第 二 , 选择 恰当 的 主题 词 , 如 针对 本 例 患者 的 处 理 , 主题 词 包括 
慢性 肝病 、 肝 纤维 化 ( fibrosis, chronic liver disease )， 超声 弹性 成 像 (ultrasound elastography ) 或 
| 者 磁 共 振 弹 性 成 像 ( magnetic resonance elastography )， 诊断 (diagnosis)。 第 三 , 建立 检索 策略 、 
实施 检索 。 循 证 医学 检索 的 基本 策略 是 首先 选择 最 新 临床 实践 指南 , 然后 选择 指南 未 纳入 的 
新 近 meta 分 析 , 最 后 选择 未 纳入 meta 分 析 的 原始 研究 文献 。 这 样 可 用 最 少 的 时 间 获 得 最 佳 
| 证 据 。 

检索 式 :(hepatic fibrosis)AND(ultrasound elastography OR magnetic resonance elastography 
[ Title/Abstract ] )。 

采用 上 述 检索 词 ,首先 检索 指南 (文献 类 型 : Practice Guideline), 我 们 在 PubMed 中 发 现 了 2 
篇 实践 指南 , 最 新 一 篇 在 2011 年 发 表 , 为 西班牙 文 发 表 的 地 方 指南 , 不 适合 我 们 现在 处 理 的 串 
者 。2010 年 发 表 的 另 一 篇 意大利 地 方 指南 , 主要 针对 非 酒精 性 脂肪 肝 的 诊断 与 处 理 , 与 目前 慢 
性 乙肝 也 不 符合 。 

其 次 是 检索 系统 综述 与 meta 分 析 ( 文 献 类 型 : Systematic Reviews ), 我 们 在 PubMed 上 发 现 
16 篇 文献 , 2 篇 与 指南 重复 , 1 篇 关于 HCV 肝 纤 维 化 , 1 篇 关于 肝 移 植 术 后 HCV 复发 肝 纤 维 化 ， 
1 篇 关于 酒精 性 肝病 肝 纤维 化 , 1 篇 为 药物 性 肝 损害 , 1 篇 非 英文 文献, 1 篇 与 主题 无 关 ; 6 篇 为 
2007 一 2010 年 期 间 发 表 的 meta 分 析 , 其 中 1 篇 2011 年 发 表 在 Journal of Hepatology 上 的 超声 弹 
性 成 像 meta 分 析 和 1 篇 2012 年 最 新 发 表 在 Journal of Hepatology 上 的 磁 共 振 弹 性 成 像 符合 
们 的 检索 要 求 。 但 未 发 现 比 较 超声 弹性 成 像 和 磁 共 振 弹 性 成 像 的 诊断 研究 , 需要 在 原始 研究 文 
献 中 继续 检索 。 

最 后 ,检索 原始 研究 文献 。 首先, 如 果 我 们 采用 上 述 检 索 式 检索 全 部 杂志 ,有 504 篇 之 多 ， 
若 将 检索 式 中 超声 弹性 成 像 或 者 磁 共 振 弹 性 成 像 中 的 OR 修改 为 AND, 目标 将 缩小 到 19 篇 。 
从 中 我 们 很 快 找到 2008 年 发 表 在 Gastroenterology 中 的 1 篇 原始 研究 文献 ,但 已 被 两 篇 meta 分 
析 纳 入 , meta 分 析 发 表 之 后 未 发 现 更 新 的 原始 研究 文献 。 








第 九 章 诊断 试验 研究 及 评价 与 实践 


三 、 评 价 检索 资料 的 科学 性 

当 收 集 到 了 相关 的 文献 资料 后 必须 按照 表 9-8 中 第 2 点 提出 的 标准 对 文献 进行 严格 评价 。 
通过 者 才 可 认为 : 设计 合理 、 科 学 , 其 结果 真实 可 和信。 以 上 述 原始 研究 为 例 进行 阐述 。 

(一 ) 试验 是 否 与 金 标 准 试验 进行 了 独立 、“ 盲 法 ”的 比较 

判断 诊断 试验 真实 性 的 最 好 方法 , 是 将 所 考核 的 诊断 试验 结果 与 “真实 ”情况 进行 比较 。 真 
实情 况 是 由 金 标准 诊断 来 确定 的 。 金 标准 的 选择 应 结合 临床 具体 情况 而 定 , 因此 , 当 找 到 相关 
文章 后 , 首先 要 检查 每 一 位 研究 对 象 在 进行 诊断 试验 时 , 是 否 都 采用 了 合适 的 金 标准 。 前 文中 
所 举 的 例子 , 其 金 标准 是 病理 组 织 学 检查 或 者 通过 肝 穿刺 活检 , 若 腹水 或 者 凝血 功能 等 影响 肝 
穿刺 , 改 用 经 颈 静 脉 肝 静脉 活检 获得 组 织 学 诊断 。 待 评 诊断 试验 为 超声 弹性 成 像 和 磁 共 振 弹 性 
成 像 , 在 方法 学 中 都 进行 了 描述 , 每 种 检查 都 是 独立 进行 的 , 结果 评价 者 不 知道 最 终 组 织 学 诊 
断 结 果 , 也 不 知道 另 一 项 检查 结果 。 

(二 ) 是 否 每 个 被 测 者 都 用 参照 试验 进行 了 评价 

有 些 情况 下 , 如 金 标准 昂贵 或 具 侵入 性 , 可 能 不 是 所 有 的 患者 都 进行 了 检测 。 研 究 者 常常 
将 试验 结果 阳性 者 , 送 去 做 金 标准 检测 , 而 阴性 者 只 抽 一 部 分 人 去 做 , 这 样 必然 夸大 了 诊断 试 
验 的 敏感 度 , 造成 偏 倚 。 在 上 述 例子 中 , 对 没有 完成 金 标准 诊断 的 13 例 患 者 进行 了 剔除 , 这 样 
的 报告 更 客观 和 真实 。 

(三 ) 所 研究 病人 样本 是 否 包括 临床 中 的 各 种 病人 

上 述 例 子 中 包括 了 临床 上 从 无 肝 纤 维 化 到 明显 肝 硬 化 的 各 种 病人 , 即便 存在 腹水 也 通过 特 
殊 检查 获得 组 织 学 诊断 纳入 。 

同时 也 应 看 到 , 文中 部 分 患者 由 于 种 种 原因 , 造成 超声 弹性 成 像 (腹水 13 例 , 肥胖 10 例 ) 
或 者 磁 共 振 弹 性 成 像 ( 幽 闭 恐 惧 症 3 例 , 血色 病 3 例 ,肥胖 2 例 ) 检 查 结果 无 法 判定 或 者 评价 失 
败 。 这 些 患者 实际 就 是 将 来 诊断 试验 应 用 时 , 应 限制 的 人 群 , 在 个 体 化 选择 诊断 试验 时 将 起 决 
定 作 用 。 

(四 ) 诊断 试验 的 可 靠 性 

上 述 例 子 中 ,作者 虽 没 有 描述 变异 系数 和 Kappa 值 , 但 全 部 测量 结果 都 经 过 了 前 后 两 次 评 
价 , 并 且 至 少 有 两 名 高 年 资 或 者 操作 有 丰富 经 验 的 专业 人 员 评 价 , 每 种 方法 的 评价 都 给 出 了 上 其 
体 的 标准 。 在 其 他 研究 报道 中 两 种 诊断 试验 结果 测量 , 也 是 可 重复 的 。 

如 果 表 9-8 中 第 2 点 标准 中 有 至 少 一 项 不 达标 , 就 说 明 诊断 试验 可 能 存在 严重 缺陷 , 使 用 
时 应 慎重 。 但 要 找到 完全 符合 上 述 标准 的 诊断 试验 文献 有 一 定 的 难度 ， 为 此 , 一 些 国际 组 织 马 
学 术 机 构 开 始 出 台 一 些 临 床 研究 报告 规范 , 以 促进 研究 质量 和 研究 水 平 的 提高 。 其 中 , 对 于 诊 
断 试 验 研 究 , 2003 年 初 在 Clinical Chemistry, 4nnals of Internal Medicine 和 BMJ 等 主流 杂志 - 
发 布 了 诊断 试验 准确 研究 报告 标准 (Standards for Reporting Diagnostic Accuracy, STARD ), 为 评定 
诊断 试验 提供 了 详细 的 可 遵照 标准 。STARD 包括 25 个 条 目 , 并 采用 了 图 标 设 计 以 提高 评价 诊 
断 研究 报告 准确 性 的 方法 学 和 信息 质量 。 

(一 ) 估计 诊断 试验 临床 应 用 的 指标 

1. 估计 疾病 的 验 前 概率 “上 述 案 例 中 提示 早期 肝 硬 化 的 特征 包括 : 35 岁 , 10 年 慢性 乙肝 
病程 .血清 学 HBsAg(+), HBcAb(+), HBeAg(+), 血清 肝 纤维 化 指标 阳性 。 临 床 判 断 早 期 肝 硬 
化 的 概率 在 50% 以 上 。 相 反 , 如 果 25 岁 患者 , 仅仅 体检 发 现 HBsAg(+), 其 他 病毒 标志 物 阴性 ， 
肝 纤 维 化 指标 均 阴 性 , 我 们 估计 早期 肝 硬 化 的 概率 不 足 1%。 即 使 年 龄 35 岁 患者 , 母亲 有 乙肝 
药 带 状态 , 并 日 患者 HBsAg(+) 来 源 于 其 母亲 , 早期 肝 硬 化 的 概率 也 不 超过 10%。 
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由 于 患 病 率 与 诊断 试验 的 阳性 预测 值 (试验 结果 阳性 时 , 患者 患 病 的 概率 , 即 验 后 概率 ) 成 
正比 ,与 诊断 试验 的 阴性 预测 值 (试验 结果 阴性 时 , 患者 不 患 该 病 的 概率 ) 成 反比 。 正 确 地 估计 
验 前 概率 就 显得 十 分 重要 。 如 果 验 前 概率 的 估计 来 自 他 人 报告 的 结果 , 应 考虑 自己 病人 的 情况 
是 否 与 其 报告 的 一 致 , 若 不 同 , 则 需 查阅 更 多 文献 以 了 解 不 同情 况 下 的 验 前 概率 。 

2. 说 明和 应 用 关于 诊断 试验 结果 的 资料 “诊断 试验 评价 指标 包括 敏感 度 、 特 异 度 、 预 测 
值 `.ROC 曲线 下 面积 、 阳 性 和 阴性 结果 似 然 比 等 指标 , 反映 试验 的 诊断 效率 。 通 常 特异 度 高 的 
试验 用 于 肯定 疾病 诊断 。 敏 感度 高 的 试验 用 于 疾病 盘查 。 相 对 于 单个 试验 , meta 分 析 资 料 更 有 
利于 临床 实践 评估 ( 表 9-9)。 





表 9-9 ” 磁 共 振 弹 性 成 像 和 超声 弹性 成 像 诊 断 明显 肝 纤维 化 和 早期 肝 硬化 的 价值 








磁 共 振 弹 性 成 像 超声 弹性 成 像 P 值 
明显 肝 纤维 化 (F0~F1 )vs.(F2~F4) 
敏感 度 0.94(0.81~0.98) 0.79(0.74~0.82) 
特异 度 0.95(0.87~0.98) 0.78(0.72~0.83) 
SROC 0.994( 0.985~1.0) 0.837(0.756~0.918) <0.05 
早期 肝 硬化 (F0~F2)vs.(F3~F4) 
敏感 度 0.92(0.85-0.96) 0.83(0.79~0.86) 
特异 度 0.96( 0.91~0.98) 0.89(0.87~0.91) 
SROC 0.985(0.968~1.0) 0.906( 0.838~0.975 ) <0.05 








3. 应 用 似 然 比 ” 似 然 比 的 含义 是 试验 的 结果 使 验 前 概率 提高 或 降低 了 多 少 。 实 际 为 验 前 
比 提高 或 者 降低 的 倍数 。 表 9-10 为 基于 验 前 概率 计算 的 验 后 概率 。 


表 9-10 ” 磁 共振 弹性 成 像 检查 判断 明显 肝 纤维 化 存在 与 否 计算 的 验 后 概率 








验 前 概率 验 前 比 试验 结果 似 然 比 验 后 比 验 后 概率 
50% 1 年 18.8 18.8 94.9% 
50% 1 . 0.063 0.063 5.9% 
10% 1/9 十 18.8 2.09 67.6% 
10% 1/9 = 0.063 0.007 0.7% 

1% 1/99 + 18.8 19.0 16.0% 
1% 1/99 0.063 0.0006 0.06% 


(二 ) 将 临床 研究 结果 用 于 自己 的 病人 

如 何 将 经 过 严格 评价 后 的 诊断 试验 结果 , 应 用 在 我 们 遇 到 的 具体 病人 身上 , 应 从 以 下 三 个 

1. 试验 结果 是 否 适用 于 我 的 病人 ”首先 要 确定 在 本 单位 或 者 推荐 的 检查 单位 是 否 已 开展 
或 能 开展 该 项 检查 , 包括 仪器 .设备 、 试 剂 .人 员 的 配备 。 还 要 考虑 将 该 试验 搬 过 来 用 于 自己 病 
人 的 测定 时 , 一 致 性 和 重复 性 如 何 。 其 次 , 对 比 系统 综述 或 文献 报道 的 研究 结果 所 报道 的 研究 
场所 (如 美国 还 是 中 国 )、 其 文化 背景 、 人 口 特征 等 是 否 与 我 所 在 单位 病人 的 情况 相同 。 两 者 的 
情况 越 接近 , 试验 结果 的 重复 性 就 越 好 。 在 本 例 中 , 肥胖 患者 的 诊断 无 论 超声 弹性 成 像 或 者 磁 
共振 弹性 成 像 都 存在 检查 结果 无 法 判定 的 问题 , 肥胖 对 超声 弹性 成 像 的 影响 更 大 。 超 声 弹性 成 
像 同 时 受 腹水 影响 , 但 对 磁 共振 没有 影响 。 

2. 如 何 合理 估计 自己 病人 的 验 前 概率 ”可 以 根据 个 人 临床 经 验 、 地 区 性 和 全 国 性 资料 或 
文献 所 报告 的 人 群 调查 结果 进行 估计 。 对 于 一 篇 报道 某 一 疾病 患 病 率 的 文献 可 用 如 下 标准 进 
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行 评估 : 

(1) 有 关 验 前 概率 的 证 据 是 否 科学 ? 具体 包括 : 被 研究 病人 是 否 代 表 了 有 这 个 临床 问题 
的 完整 的 疾病 谱 ? @ 对 于 确诊 的 每 一 条 标准 是 否 明确 和 可 靠 ?@ 诊 断 的 程序 是 否 全 面 并 能 持 
续 应 用 ? @ 对 于 最 初 没 有 诊断 出 来 的 病人 是 否 进行 了 足够 长 时 间 和 完整 的 随访 ? 

(2) 有 关 验 前 概率 的 证 据 是 否 重要 ?具体 包括 : @ 诊 断 的 是 什么 病 ? 其 概率 是 多 少 ? 名 对 
于 疾病 概率 估计 的 精确 程度 。 

符合 上 述 标准 文献 数据 可 以 用 于 自己 病人 患 病 概率 的 估计 。 分 两 种 情况 : 若 诊治 条 件 和 病 
人 特征 与 文献 类 似 , 可 直接 采用 文献 的 验 前 概率 ; 若 诊断 条 件 、 病 人 特征 与 文献 报道 不 同 , 则 可 
以 文献 报告 的 验 前 概率 作为 基点 ,根据 病人 实际 情况 进行 调整 , 观察 验 后 概率 的 变化 , 最 后 确 

3. 验 后 概率 的 结果 是 否 改变 了 对 病人 的 处 理 ”在 本 例 中 , 35 岁 , 10 年 慢性 乙肝 病程 、 血 清 
学 HBsAg(+), HBcAb(+), HBeAg(+), 血清 肝 纤 维 化 指标 阳性 。 临 床 判断 早期 肝 硬 化 的 概率 
50%, 即 验 前 概率 为 50%, 诊断 试验 阳性 , 肝 纤 维 化 或 者 肝 硬 化 验 后 概率 达到 94.9% , 抗 病毒 治 
疗 就 非常 必要 , 反之 , 若 概率 低 于 $.9%, 可 暂时 不 选择 抗 病毒 治疗 。 

车 一 名 25 岁 就 诊 者 , 仅仅 体检 发 现 HBsAg(+), 其 他 病毒 标志 物 阴 性 , 肝 纤 维 化 指标 均 阴 
性 , 我 们 估计 早期 肝 硬 化 的 概率 不 足 1%。 即 使 磁 共 振 弹性 成 像 诊断 试验 结果 为 阳性 , 验 后 概率 
仅 16% , 抗 病毒 治疗 的 证 据 并 不 充分 。 

又 假设 一 名 年 龄 35 岁 患者 前 来 就 诊 , 母亲 有 乙肝 携带 状态 , 并 且 患 者 HBsAg(+) 来 源 于 其 
母亲 , 早期 肝 硬 化 的 概率 估计 10% , 磁 共 振 弹 性 成 像 结 果 阳 性 , 验 后 概率 67.6%, 如 何 选择 处 理 ， 
是 抗 病毒 治疗 或 者 暂时 不 抗 病毒 治疗 ? 

这 里 引出 了 “诊断 闻 值 ” 和 "治疗 冰 值 " 两 个 概念 。 决 定 一 项 诊断 试验 是 否 重要 时 , 我 们 关 
注 的 是 该 试验 在 鉴别 有 病 和 无 病 时 的 正确 性 以 及 其 改变 我 们 在 做 试验 前 估计 到 病人 患 病 可 能 
性 与 试验 后 估计 的 患 病 可 能 性 的 能 力 , 能 较 大 地 改变 验 前 和 验 后 概率 的 试验 , 对 我 们 临床 实践 
是 重要 和 有 用 的 。 也 就 是 说 只 有 当 某 一 项 诊断 试验 能 使 验 前 和 验 后 概率 发 生 较 大 变化 , 而 且 这 
种 变化 会 对 是 否 要 继续 进行 另 一 项 检查 或 对 治疗 计划 的 改变 有 影响 时 , 才能 认为 这 项 诊断 试验 
的 确 对 病人 是 有 帮助 的 。 

如 果 诊 断 试验 的 目的 是 为 了 决定 是 否 对 病人 进行 治疗 , 此 时 不 仅 要 了 解 该 诊断 试验 的 有 效 
性 , 更 重要 的 是 评估 通过 该 项 试验 的 阳性 或 者 阴性 结果 带 来 的 对 病人 治疗 方案 决策 的 结果 是 否 
发 生变 化 。 新 试验 是 否 增 加 了 信息 , 如 果 做 了 该 试验 后 , 能 增加 已 有 的 信息 导致 治疗 措施 的 改 
变 , 从 而 最 后 给 病人 带 来 益处 , 这 项 试验 就 是 有 价值 的 。 因 此 , 试验 原则 是 使 用 有 可 能 改变 处 
理 方案 的 试验 , 而 治疗 原则 是 选用 利 大 于 浆 的 治疗 方案 。 我 们 用 早期 肝癌 诊断 与 处 理 为 例 说 明 
行动 点 、 诊 断 间 值 和 治疗 阔 值 。 

让 我 们 先 来 看 看 治疗 的 情况 。 早 期 肝癌 的 治疗 ,手术 切除 作为 首选 , 但 即使 这 样 ,手术 仍 
存在 一 定 风 险 。 我 们 假设 早期 肝癌 手术 后 3 年 存活 率 为 80%, 疾病 本 身 、 肝 功能 状态 以 及 手术 
创伤 的 死亡 率 达到 20%, 而 如 果 采 取 其 他 措施 包括 积极 观察 病情 变化 而 不 立即 采用 手术 治疗 ， 
可 能 的 结果 是 : 存活 率 下 降 到 50%, 死亡 率 上 升 到 50%。 与 暂时 观察 相 比 , 及 时 手术 显然 利 大 
于 瞪 ; 80%- 50%= 30%, 即 存活 率 提高 30%, 死亡 率 下 降 30%。 如 果 没 有 别 的 选择 , 合理 的 决 
策 一 定 是 选择 及 时 手术 治疗 ( 表 9-11)。 




















表 9-11 对 于 已 确诊 的 疾病 











是 否 有 病 是 否 治 ; 存活 率 死亡 率 
有 是 80% 20% 
有 否 50% 50% 
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上 面 的 处 理 决 策 是 在 疾病 诊断 明确 的 情况 下 , 手术 方案 利 大 于 弊 , 有 高 于 30% 的 存活 率 ， 
但 假如 疾病 诊断 的 概率 不 是 100% 呢 ? 出 现 诊断 错误 时 , 如 果 选 择 暂时 观察 , 不 会 出 现 手术 带 
来 的 风险 , 即使 需要 择期 手术 , 也 几乎 可 完全 治愈 ; 相反 , 如 果 选 择 及 时 手术 , 在 病人 一 般 状况 
没有 改善 的 情况 下 ,手术 本 身 的 风险 及 死亡 率 可 能 达到 10%。 因 此 ,与 暂时 观察 相 比 , 及 时 手 
术 的 结果 是 增加 了 10% 的 死亡 风险 。 对 不 能 确诊 的 疾病 , 临床 决策 还 依赖 于 对 疾病 诊断 的 可 
能 性 大 小 , 即 诊 断 概率 ( 表 9-12)。 





表 9-12 ”对 于 尚未 确诊 的 疾病 





是 否 有 病 是 否 治疗 存活 率 死亡 率 
有 是 80% 20% 
有 否 50% 50% 
无 否 100% 0% 
无 是 90% 10% 





如 果 诊 断 该 疾病 的 可 能 性 , 即 概率 为 90%, 选择 及 时 手术 治疗 : 患者 得 到 的 好 处 为 27%, 即 
90%( 患 病 可 能 性 )x(80%- 50%)( 生 存 率 增加 ), 而 可 能 出 现 的 害处 是 1%, 即 10%( 诊断 错误 可 
能 性 )x(100% 一 90%)( 生 存 率 减少 ), 此 时 的 合理 决策 仍 是 选择 及 时 手术 。 

如 果 诊 断 疾病 的 可 能 性 , 即 概率 为 10%, 选择 及 时 手术 治疗 : 患者 得 到 的 好 处 是 3%, 即 
10% x(80% 一 50% ), 而 可 能 出 现 的 害处 是 9%, 即 90% x(100% 一 90%), 合理 决策 是 暂时 不 考虑 
手术 。 

在 10%~90% 之 间 , 可 以 找到 一 个 概率 点 ,在 这 点 上 , 治疗 的 利 次 相当 。 在 这 点 之 上 , 治疗 
利 大 于 紫 , 选择 该 治疗 ; 在 这 点 之 下 , 治疗 次 大 于 利 ,暂时 不 选择 该 治疗 。 在 本 例 中 , 患 病 可 能 
性 x(80% 一 50%)=(1 一 患 病 可 能 性 )x(100% 一 90%), 患 病 的 可 能 性 , 即行 动 点 为 25%。 

在 上 述 的 案例 分 析 中 ,前 提 条 件 是 没有 可 以 帮助 进一步 确定 或 者 排除 该 疾病 的 诊断 手段 。 
因此 ,如果 患者 不 是 来 源 于 肝 硬 化 人 群 ; 也 没有 B 型 彩超 结果 阳性 , 依据 患者 有 慢性 乙 型 肝炎 
基础 (基础 概率 1%), AFP 阳性 (阳性 似 然 比 =8), 增强 CT 检查 阳性 (阳性 似 然 比 = 3.9), 该 患 
者 肝癌 可 能 性 达到 24.0%, 如 果 没 有 其 他 试验 可 以 进一步 选择 , 可 以 直接 决策 , 即 选择 手术 切除 

而 实际 上 , 肝癌 的 诊断 还 有 很 多 其 他 方法 。 一 方面 , 通过 检查 明确 患者 是 否 有 肝 硬 化 , 增 
加 肝癌 患 病 可 能 性 ( 即 基础 串 病 率 ), 另 一 方面 , 接受 如 磁 共 振 检查 、 血 管 造影 检查 、 超 声 引 导 下 
穿刺 活检 病理 组 织 学 检查 等 帮助 我 们 进一步 确定 或 者 排除 肝癌 。 治 疗 决策 又 会 是 怎样 7 是 否 
需要 在 术 前 选择 其 中 一 种 或 者 多 种 检查 ? 

处 理 ( 手 术 ) 与 不 处 理 ( 暂 时 不 手术 ) 的 利弊 已 经 明确 , 行动 点 在 25% 的 概率 水 平 。 目 前 患者 
肝癌 的 可 能 性 估计 为 24.0%。 如 有 更 多 诊断 试验 可 以 选择 , 是 否 选择 取决 于 诊断 试验 的 优 劣 。 

首先 考虑 磁 共 振 , 除了 增加 费用 之 外 , 没有 过 敏 等 副作用 , 安全 性 很 好 , 医院 可 以 提供 (可 
获得 性 ), 患者 接受 程度 也 很 高 (可 接受 程度 ), 是 否 选择 、 取 决 于 其 诊断 效率 , 即 敏感 度 和 特异 
度 。 文 献 报 告 磁 共 振 诊断 肝癌 的 敏感 度 为 86%, 特异 度 为 81%。 有 目前 患 肝 瘤 诊断 可 能 性 仍 为 
24.0%, 试验 结果 阴性 ,疾病 的 可 能 性 , 即 概率 会 减少 , 没有 改变 随访 选择 。 但 若 试验 结果 阳性 ， 
疾病 的 可 能 性 , 即 概率 增加 , 从 24.0% 提高 到 25% 之 上 , 则 可 能 支持 及 时 手术 治疗 。 因 此 我 们 
选择 磁 共 振 检查 。 

在 上 述 案例 中 , 如 果 患 者 B 超 和 CT 都 发 现 占 位 考虑 肝癌 , 患 病 可 能 性 为 55.8% , 我 们 是 否 
还 会 选择 进行 MRI 检查 呢 ? 试验 结果 阳性 , 直接 手术 , 没有 改变 我 们 的 决定 , 无 须 检查 ; 试验 结 
果 阴 性 ,根据 试验 的 敏感 度 和 特异 度 , 推算 : 

诊断 试验 的 阴性 似 然 比 为 :( 1 敏感 度 )/ 特 异 度 =(1 一 86%)/81%= 14/81 























第 九 章 ”诊断 试验 研究 及 评价 与 实践 


验 前 概率 为 55.8% , 验 前 比 为 : 55.8%/44.2%= 1.26; 验 后 比 为 : 1.26 x(14/81)=0.218, 则 : 验 
后 概率 =0.218/(1+0.218)x 100%= 17.5%。 

这 一 结果 已 低 于 行动 点 (概率 为 25%), 所 以 应 该 为 患者 选择 磁 共 振 检查 , 因为 检查 结果 阳 
性 更 支持 肝癌 诊断 , 支持 手术 治疗 , 而 阴性 结果 则 可 能 改变 我 们 手术 治疗 的 选择 。 

另 一 种 情况 , 假如 我 们 知道 , 该 患者 基础 患 病 的 可 能 性 为 1%, 是 否 直 接 接受 磁 共振 检查 
(如 作为 一 种 高 危 人 群 普查 项 目 ) 而 不 先进 行 AFP 检查 、B 型 超声 检查 、CT 检查 呢 ? 让 我 们 先 分 
析 一 下 直接 检查 磁 共 振 的 结果 。 如 果 磁 共振 试验 阴性 , 患 病 可 能 性 即 概率 减少 , 不 支持 及 时 手 
术 治 疗 , 没有 改变 选择 ; 试验 结果 磁 共 振 阳性 , 疾病 的 可 能 性 即 概率 会 增加 。 根 据 试 验 的 敏感 
度 和 特异 度 , 阳性 似 然 比 为 : 敏感 度 /(1- 特异 度 )=(86%)/(1-81%)=4.5; 验 前 概率 为 1%, 验 
前 比 为 : 1%/99% = 1/99; 验 后 比 为 :(1/99)x4.5=4.5/99=0.046。 

则 : 验 后 概率 =(0.046)/(1+0.046)x100%=4.4%。 

这 一 结果 没有 高 于 行动 点 (概率 为 25% ), 无论 该 试验 结果 如 何 , 仍然 选择 放弃 手术 治疗 ， 
诊断 试验 对 治疗 决策 没有 影响 , 因此 直接 选择 该 诊断 试验 是 不 合理 的 。 

如 果 从 1% 基础 水 平 逐 渐 增 加 患 病 的 可 能 性 , 可 以 找到 一 点 , 在 这 点 之 下 , 无 须 进 行 该 诊 
断 试验 , 因为 无 论 该 试验 结果 如 何 , 我 们 都 选择 观察 , 在 这 点 之 上 , 进行 诊断 试验 , 如 果 试 验 结 
果 阳 性 , 患 病 的 概率 可 能 上 升 到 25% 以 上 , 将 改变 处 理 患者 的 决策 , 这 一 点 称 为 诊断 疮 值 (test 
thresholds )。 

诊断 闽 值 比 = 行动 点 比 / 阳 性 似 然 比 =(13)/[(86%)/(1-81%)]=1/45=0.074, 则 : 诊断 冰 
值 概率 =0.074/(1+0.074)x 100%=6.9%。 

从 90% 逐渐 往 下 降低 患 病 概率 , 可 以 找到 一 点 , 在 这 点 的 患 病 概 率 上 , 无 须 进 行 该 诊断 试 
验 ( 磁 共振 检查 ), 因为 无 论 试验 结果 如 何 ,我们 都 选择 手术 治疗 ; 在 这 点 之 下 , 进行 诊断 试验 ， 
如 果 试 验 结果 阴性 , 患 病 的 概率 下 降 到 25% 以 下 , 将 改变 我 们 处 理 患者 的 决策 , 这 一 点 称 为 治 
疗 阔 值 (treatment thresholds )。 

治疗 阔 值 比 = 行动 点 比 /阴性 似 然 比 =(13)/[(1-86%)/81% ]= 1.69, 则 : 治疗 阔 值 概率 = 
1.69/( 1+1.69)x 100%=62.7%。 























Observe Test Treat 
0% Obs/Test ATopps Test/Treat 100% 
诊断 阔 值 (6.9%) 行动 点 (25%) 治疗 阅 值 (62.7% ) 


图 9-6 行动 点 .诊断 闻 值 、 治 疗 阅 值 示意 图 


如 果 诊 断 概率 出 现下 列 情况 ,以 下 为 合理 处 理 : 诊断 闻 值 之 下 , 无须 进 一 步 诊断 试验 , 直 
接 决定 暂时 观察 ; @ 介 于 诊断 辣 值 与 行动 点 之 间 , 需 要 进一步 诊断 ; 若 没有 其 他 诊断 试验 , 这 时 
采取 的 治疗 害处 大 于 好 处 ,采取 治疗 要 慎重 ; @ 介 于 行动 点 与 治疗 立 值 之 间 , 需要 进一步 诊断 ; 
若 没有 其 他 诊断 试验 , 这 时 采取 的 治疗 好 处 大 于 害处 , 可 以 采取 治疗 ; @ 大 于 治疗 阅 值 , 无 须 进 
一 步 诊断 试验 , 直接 决定 治疗 ; @ 介 于 诊断 阅 值 与 治疗 阔 值 之 间 , 如 有 其 他 诊断 试验 , 需要 还 一 
步 诊断 , 直到 达到 治疗 阔 值 才 开始 治疗 (理论 上 ) 

可 以 看 到 ,患者 在 基础 状态 下 , 肝癌 患 病 率 仅 1% 时 ,我们 首先 选择 了 AFP 检查 与 B 型 超声 
检查 ,因为 在 肝癌 患 病 率 低 于 6.9% 的 人 群 中 直接 进行 磁 共振 检查 即使 阳性 也 不 适合 直接 选择 
手术 处 理 。 而 直接 选择 磁 共振 检查 也 违背 了 诊疗 流程 遵循 的 其 他 原则 包括 检查 费用 低 、 安 全 性 
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好 、 可 接受 程度 高 、 可 获得 性 高 (在 一 般 医院 都 可 以 获得 ) 等 。 

回 到 我 们 的 临床 案例 中 , 患者 AFP 阳性 结果 , 肝癌 患 病 率 从 1% 提高 到 8% , 我 们 在 前 面 的 
案例 中 分 析 了 增强 CT 检查, 并 进行 了 选择 获得 了 阳性 结果 。 我 们 是 否 可 以 不 选择 增强 CT 检查 
而 直接 选择 磁 共 振 检查 呢 ? 

如 果 直 接 选择 磁 共 振 检 查 , 阳性 结果 似 然 比 为 45, 患者 阳性 结果 , 肝癌 患 病 概率 从 8% 提高 
到 28.1%, 超过 决策 处 理 的 25%, 因此 同样 可 以 选择 。 让 我 们 比较 以 下 两 种 试验 的 差异 ( 表 9-13)， 
由 于 磁 共 振 的 特异 度 更 高 , 而 且 无 造影 剂 过 敏 或 者 造影 剂 可 能 带 来 不 良 影响 的 疾病 如 肾 功能 不 
全 , 可 以 优先 选择 磁 共 振 。 阳 性 结果 提供 了 更 高 的 患者 肝癌 诊断 可 能 性 (24.0% vs. 28.1%)。 但 
无 论 首先 选择 何 种 试验 , 阴性 结果 可 以 就 此 观察 , 而 阳性 结果 都 需要 进一步 选择 男 一 个 试验 加 
以 验证 。 


表 9-13 ”增强 CT 与 磁 共振 诊断 肝癌 检查 比较 














比较 内 容 增强 CT 检查 磁 共 振 检 查 
诊断 基础 影像 学 特征 , 占 位 影像 学 特征 , 占 位 
诊断 效率 
敏感 度 90o% 86% 
特异 度 77% 81% 
阳性 结果 似 然 比 3.9 4.5 
阴性 结果 似 然 比 10/77 14/81 
可 获得 性 三 级 医院 三 级 医院 
易 接受 程度 中 等 ( 相 比 抽 血 /造影 或 活检 ) 中 等 ( 相 比 抽 血 /造影 或 活检 ) 
费用 (元 ) 600~1000 600~1000 
安全 性 有 造影 剂 过 敏 可 能 , 可 能 带 来 肾脏 ”过敏 可 能 小 , 体内 存在 金属 物 不 
影响 适用 
在 该 患者 中 的 应 用 
基础 患 病 率 1%+AFP 阳 性 。 24.0% 28.1% 
交叉 检查 阳性 结果 58.7% 58.7% 
基础 患 病 率 10%+AFP 阳 性 ”77.6% 80.0% 
交叉 检查 阳性 结果 94% 94% 


如 果 患 者 基础 状态 存在 肝 硬 化 ( 患 病 率 从 1% 提高 到 10%, AFP 阳性 , 患 病 率 提高 到 30.7% )， 
CT 检查 或 者 磁 共 振 检查 阳性 , 则 患者 肝癌 的 可 能 性 分 别 增加 到 93% 和 87% , 都 不 需要 进一步 
选择 另 一 项 检查 印证 , 而 可 以 直接 处 理 。 可 见 基础 患 病 率 即 来 源 人 和 群 不 同 明显 影响 诊断 试验 对 
结果 的 判定 作用 。 

是 否 CT 阳性 肝癌 诊断 达到 77.6% 的 可 能 性 或 者 磁 共 振 阳 性 肝癌 诊断 达到 80% 的 可 能 性 就 
一 定 能 选择 手术 治疗 呢 ? 或 者 CT 与 磁 共振 检查 其 中 一 项 为 阳性 结果 , 另 一 项 为 阴性 结果 , 我们 
应 该 考虑 进一步 检查 如 血管 造影 检查 ( 表 9-14 )。 其 敏感 度 和 特异 度 均 达到 98% 和 98% , 阳性 
结果 似 然 比 为 49, 阴性 结果 似 然 比 为 149。 在 很 多 情况 下 血管 造影 或 者 穿刺 组 织 学 检查 作为 评 
价 CT 或 者 磁 共 振 等 检查 的 金 标准 。 但 因 其 具有 一 定 创伤 性 .部 分 患者 难于 接受 .存在 一 定 风险 
并 且 费 用 较 高 等 ,只 有 在 存在 争议 、 各 种 检查 不 一 致 的 情况 下 临床 才 选 择 。 

敏感 度 =98% , 特异 度 =98%, 阳性 预测 值 =98/100 x 100%= 98% , 阴性 预测 值 = 98/100x 
100%=98% , 阳性 似 然 比 =98%/2%=49, 阴性 似 然 比 =2%/98%= 1/49 

假设 CT 检查 结果 阳性 , 患者 来 源 于 肝 硬 化 人 群 ,肝癌 可 能 性 77.6%。 如 果 血 管 造影 结果 阳 
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表 9-14 ”血管 造影 诊断 肝癌 临床 评价 











金 标准 评价 最 终结 果 
肝癌 非 肝 瘤 
血管 造影 判断 (+) 98(98% ) 2(2% ) 
血管 造影 判断 (一 ) 2(2%) 98(98%) 


性 , 疾病 的 可 能 性 即 概率 增加 , 支持 及 时 手术 治疗 , 没有 改变 选择 ; 如 果 试 验 结果 阴性 , 疾病 的 
可 能 性 即 概率 会 减少 。 根 据 试验 的 敏感 度 和 特异 度 , 推算 验 后 概率 为 6.6%, 低 于 25%, 仍 应 该 
选择 进行 这 项 检查 。 

阴性 似 然 比 为 :(1- 敏 感度 )/ 特 异 度 =(1-98%)/98%= 1/49; 验 前 概率 为 77.6%, 验 前 比 为 : 
77.6%/22.4%= 3.46; 验 后 比 为 : 3.46 x(1/49)=0.071; 则 : 验 后 概率 =0.071/(1+0.071)x 100%= 
6.6%。 

特别 需要 强调 的 是 , 权衡 利弊 还 需要 考虑 决策 时 间 , 利弊 可 以 用 临床 疗效 和 不 良 反应 评 
估 , 也 可 以 包括 生存 质量 临床 成 本 。 如 果 我 们 知道 抗 病毒 治疗 与 暂时 不 抗 病毒 治疗 的 利弊 ， 
我 们 就 可 以 回答 前 面 案例 中 提 及 的 患者 , 通过 磁 共 振 弹 性 成 像 诊 断 早期 肝 硬 化 验 后 概率 上 升 到 
67.6%, 是 否 需 要 选择 抗 病毒 处 理 , 或 者 是 否 有 必要 进一步 采用 创伤 性 检查 即 肝 穿刺 活检 评估 诊 
断 。 临 床上 疾病 常常 处 于 动态 变化 过 程 中 , 临床 疾病 诊断 的 概率 也 在 不 断 变 化 , 对 于 不 能 等 待 
的 疾病 或 者 状态 ,需要 及 时 作出 决策 ; 对 于 可 以 等 待 的 疾病 或 者 状态 , 可 以 选择 暂时 观察 , 但 需 
要 评估 等 待 的 风险 。 


五 .小 结 


总 之 ,我 们 在 开 出 医嘱 做 某 项 诊断 试验 前 应 考虑 : @ 验 前 概率 是 多 少 ? 对 病人 诊断 还 有 多 
大 疑问 ”是否 需要 做 这 项 检查 ? @@ 该 项 检查 如 果 漏 诊 或 误诊 会 对 病人 带 来 多 大 危 书 ? @ 这 项 
检查 的 似 然 比 能 否 改 变 进 一 步 临 床 决策 。 当 然 还 应 考虑 到 做 该 项 检查 的 危险 性 、 费 用 以 及 做 该 
项 检查 的 迫切 性 。 通 过 实施 上 述 步骤 使 医生 对 病人 的 处 理 更 具 科学 性 。 

Price 曾 提 出 诊断 试验 的 结果 常常 被 作为 是 决策 分 析 中 的 一 部 分 , 从 实施 诊断 试验 开始 到 最 
终 作 决策 之 间 的 各 阶段 以 自 下 到 上 的 阶梯 式 来 表示 (图 9-7), 第 一 步 为 试验 的 技术 指标 (technical 
performance ), 包括 试验 的 精确 性 、 准 确 性 范围 , 结果 说 明 以 及 其 他 因素 如 生物 学 变异 .标本 的 稳 
定性 对 试验 结果 的 影响 。 第 二 步 为 诊断 过 程 (diagnostic performance ), 包括 对 目 标 人 群 的 测定 ， 
试验 的 敏感 度 和 特异 度 、 不 同 患 病 率 人 群 中 的 预测 值 , 似 然 比 及 其 对 验 后 概率 的 影响 。 也 可 用 
需要 诊断 的 人 数 (number needed to diagnose, NND ) 来 表示 , NND = 1/[ 敏感 度 -(1- 特异 度 )]。 
NND 有 助 于 试验 之 间 的 比较 。 第 三 步 为 对 临床 的 影响 (clinical impact), 包括 : 对 诊断 步骤 的 
影响 ,例如 与 其 他 试验 比较 ,对 提高 诊断 效率 的 作用 ; @ 对 治疗 策略 的 影响 , 例如 对 选择 最 优 治 
疗 手段 、 减 少 和 避免 治疗 的 副作用 方面 有 何 影响 ; @ 对 健康 结局 的 影响 , 例如 微 球 蛋白 测定 对 
早期 发 现 糖尿 病 肾病 、 较 好 地 处 理 糖尿 病 的 伴 发 病 高 血压 以 及 降低 肾 功能 衰竭 方面 的 作用 。 第 
四 步 为 对 组 织 管 理 的 影响 (organization impact), 包括 应 用 某 诊 断 试验 后 是 否 可 减少 住院 天 数 、 
减少 医生 所 花费 的 时 间 和 设备 的 消耗 是 否 降低 了 医疗 资源 的 消耗 。 第 五 步 是 经 济 评价 (cost- 
effectiveness ), 通过 成 本 - 效果 分 析 , 了 解 诊断 试验 的 经 济 效果 。 特 别 当 一 项 新 试验 比 老 的 试验 





经 济 评价 得 出 结论 。 总 之 , 以 上 每 一 步 对 决策 分 析 均 十 分 重要 , 根据 上 述 各 步 提 供 的 证 据 , 再 
结合 自己 病人 情况 才能 作出 是 否 要 采用 该 项 试验 的 决定 。 

决策 的 最 终结 果 是 为 了 改善 病人 的 健康 结局 。 如 果 一 项 试验 可 以 改变 诊断 步骤 或 (和 ) 治 
疗 策略 , 其 结果 在 总 体 上 可 改善 病人 健康 结局 的 , 就 是 对 临床 有 益 的 试验 。 





笔记 
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图 9-7 设计 利于 决策 分 析 的 循 证 实践 证 据 阶梯 


目前 循 证 医学 在 诊断 试验 范围 内 的 应 用 还 不 够 广泛 , 突出 表现 在 不 同 医院 对 同一 种 疾病 采 
用 的 诊断 步骤 和 检查 项 目 各 不 相同 , 差异 很 大 , 其 中 有 许多 属于 诊断 试验 应 用 不 当 或 选用 不 合 
理 。 因 此 , 在 具体 病例 的 实践 中 , 要 学 会 选择 恰当 的 诊断 试验 , 并 对 患者 做 出 循 证 决策 。 
( 陈 世 浪 ” 张 宁 萍 ) 
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临床 治疗 研究 与 评价 是 临床 流行 病 学 与 循 证 医学 的 重要 内 容 之 一 。 目 前 , 许多 疾病 的 治疗 
药物 .方法 和 手段 日 趋 多 样 化 , 如 何 从 中 选择 安全 、 有 效 的 干预 措施 , 指导 临床 实践 决策 ,已 成 
为 临床 工作 的 一 项 重要 任务 。 努 力学 习 和 掌握 必要 的 治疗 性 研究 与 评价 方法 对 医务 工作 者 具 
有 重要 的 意义 。 8 

治疗 性 研究 是 指 在 临床 实践 中 以 人 为 研究 对 象 , 应 用 医学 科研 的 理论 和 方法 , 通过 严谨 的 
设计 (design)、 精 确 的 测量 (measurement) 对 欲 选择 的 治疗 方法 或 方案 进行 的 科学 研究 与 客观 评 
价 (evaluation )。 高 质量 的 研究 结果 可 以 作为 证 据 , 再 进一步 结合 患者 意愿 和 现 有 医疗 条 件 制定 
出 最 佳 治疗 决策 , 以 达到 提高 治愈 率 , 降低 病 残 及 病死 率 , 提高 生存 质量 以 及 改善 人 体 健 康 的 
目的 。 

治疗 性 研究 与 评价 的 内 容 既 可 以 是 药物 、 术 式 等 治疗 手段 , 也 可 以 是 各 种 预防 性 干预 措施 。 
既 可 以 进行 原始 研究 与 评价 , 也 可 以 进行 二 次 研究 与 评价 。 


第 一 节 ”治疗 性 研究 与 评价 概述 


一 、 治 疗 性 研究 与 评价 的 重要 性 

在 临床 实践 中 , 常常 需要 观察 和 评价 某 些 措施 疗效 的 大 小 。 但 由 于 存在 可 能 影响 疗效 评价 
的 其 他 因素 , 例如 样本 量 大 小 、 样 本 代表 性 及 组 间 可 比 性 等 , 因此 研究 结果 不 一 定 是 真实 可 靠 的 。 
所 以 对 那些 自称 具有 “显著 ”临床 疗效 的 治疗 措施 , 只 有 经 过 科学 研究 和 严格 评价 才能 确认 。 

首先 , 治疗 措施 在 体外 实验 中 观察 到 的 效果 须 经 严格 的 临床 验证 才能 证 明 其 是 否 有 效 。 以 
动物 为 研究 对 象 或 体外 实验 完成 的 结论 不 能 直接 用 于 人 体 。 如 体外 实验 证 实 阿 糖 胞 苷 (Ara-c ) 
有 干扰 喀 啶 合成 的 作用 , 可 抑制 多 种 DNA 病毒 , 能 抑制 播 散 性 带 状 疱疹 病毒 , 但 经 临床 试验 发 
现 , Ara-c 不 仅 对 播 散 性 带 状 疱疹 的 临床 治疗 无 效 , 反而 有 害 。 

其 次 , 临床 试验 过 程 中 , 特别 是 在 设计 、 资 料 收集 、 分 析 评 价 等 方面 均 可 能 受 偏 倚 的 影响 ， 
得 出 错误 的 结论 。 因 此 , 只 有 经 过 科学 验证 和 严格 评价 , 才能 确定 新 药物 、 新 疗法 的 真实 效果 。 

最 后 ,临床 经 验 本 身 不 是 科学 证 据 ,也 只 有 经 过 科学 的 效果 评价 , 才能 确认 。 如 : 曾 风行 一 
时 的 胃 冰 冻 疗 法 治疗 消化 性 溃疡 、 乳 房 内 动脉 结扎 治疗 顽固 性 心绞痛 以 及 国内 曾 盛行 的 鸡 血 疗 
法 、 甩 手 疗 法 、 针 焦 哑 门 穴 治 疗 瑟 哑 等 ,后 经 科学 证 实 均 无 效 。 
近 些 年 来 , 随 着 临床 流行 病 与 循 证 医学 的 发 展 , 许多 临床 医生 已 经 逐渐 地 认识 到 应 用 科学 的 
研究 设计 , 如 多 中 心 .前 瞻 性 、 随 机 双 盲 .平行 对 照 临床 试验 对 临床 疗效 评价 的 重要 性 。 开 展 高 质 
量 的 临床 试验 , 既 能 保证 获得 真实 可 靠 的 结果 , 又 会 促进 临床 医学 研究 和 临床 工作 的 不 断 发 展 。 

二 、 治 疗 性 研究 与 评价 的 基本 条 件 

一 项 治疗 性 研究 能 否 得 到 实施 ,一般 要 考虑 下 列 条 件 : 

(一 ) 具有 充分 的 科学 依据 

每 项 临床 疗效 评价 研究 都 要 有 清楚 的 研究 背景 和 充分 的 立 题 依据 , 以 及 明确 的 试验 目的 ， 
而 不 能 仅 凭 经 验 来 做 假设 或 推断 。 早 在 1964 年 第 18 届 世 界 医学 大 会 通过 并 经 数 次 修改 的 《 赫 
尔 辛 基 宣 言 》( The Declaration of Helsinki), 是 人 体 试验 应 遵循 的 基本 准则 , 规定 :“ 凡 涉及 人 体 
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的 生物 医学 试验 , 必须 遵循 科学 的 原 刚 ， 





应 建立 在 足够 的 实验 室 和 动物 实验 及 科学 文献 认识 的 
基础 之 上 。 意味 着 用 于 人 体 治疗 性 试验 的 任何 药物 或 措施 , 在 针对 疾病 发 病 的 机 制 或 对 某 种 
环节 的 干预 应 有 理论 依据 ， 同时 还 应 该 具有 药物 化 学 .药理 学 、 毒 理学 、 药 动 学 以 及 药 效 学 等 研 
| 究 基 础 。 在 初步 证 明 具 有 安全 性 和 有 效 性 之 后 , 方 可 投入 临床 治疗 性 试验 。 如 单 硝酸 -s- 2 
| 梨 栈 醇 ( isosorbide-s-mononitrate ， JIS-S-MN ) 对 预防 性 治疗 食管 静脉 再 出 血 的 研究 ， 研究 者 在 研究 
| 前 首 先 详 细 地 了 解 了 食管 静脉 曲张 出 血 及 再 出 血 的 发 生 率 和 病死 率 , 同时 了 解 了 国内 引起 食管 
静脉 曲张 出 血 的 主要 原因 , 进而 分 析 了 食管 静脉 曲张 出 血 的 各 种 影响 因素 , 比较 了 内 镜 和 普 至 
治 尔 等 治疗 方法 的 优 缺 点 等 。 通 过 反复 论证 , 研究 者 提出 19-S-MN 可 能 比 普 蔡 治 尔 的 副作用 小 
但 疗效 佳 的 假设 ,尽管 研究 者 发 现 国外 已 有 此 方面 的 文献 报道 ,但 样本 量 太 小 , 尚 不 能 作出 肯 
定 结论 故 认为 有 必要 进行 此 项 临床 治疗 试验 
| (二 ) 明确 研究 设计 拟 达到 的 最 佳 目 标 i 
个 同 疾病 均 具有 各 自 特点 和 不 同 的 结局 表现 , 同时 药物 或 治疗 措施 也 都 有 着 各 自 不 同 的 治 
疗效 能 。 利用 某 种 药物 或 某 种 治疗 措施 达到 疾病 根治 的 目的 往往 不 现实 , 因此 ， 治疗 的 预期 目 
标 , 除了 要 考虑 治愈 和 根治 外 , 还 要 考虑 症状 缓解 ,功能 维持 , 预防 复发 或 并 发 症 等 , 应 基于 奖 
病 的 具体 特点 和 试验 药物 本 身 的 效能 进行 审慎 的 选择 。 如 果 所 观察 的 疾病 是 可 被 治愈 或 根治 
的 ,那么 治 您 或 根治 就 为 研究 拟 达 到 的 最 佳 目标 。 如 外 科 手 术 可 达到 根治 早期 肿瘤 的 目的 等 
而 有 些 疾病 在 某 种 情况 下 有 可 能 复发 或 发 生 某 种 并 发 证 而 引起 更 为 严重 的 后 果 ,那么 有 效 地 匠 
| 防 复发 或 减少 某 些 并 发 症 的 发 生 , 就 作为 拟 达 到 的 目的 。 如 对 脑 醒 死 恢复 期 病人 , 临床 治疗 的 
目标 应 是 预防 其 再 次 复发; 而 某 些 不 能 彻底 治 全 的 慢性 病 患 者 , 临床 治疗 的 目标 主要 在 于 缓解 
症状 , 最 大 限度 地 改善 其 功能 状态 及 生存 质量 。 如 类 风湿 疾病 治疗 等 ,其 目的 就 是 控制 疼痛 、 
| 防止 畸形 、 改 善 生存 质量 等 。 
(三 ) 选择 最 有 效 的 试验 药物 或 措施 司 类 
临床 治疗 性 药物 或 措施 的 选择 , 除了 要 有 科学 依据 及 安全 有 效 性 证 据 外 ， 还 应 考虑 从 同类 
各 移 或 措施 中 选择 最 为 有 效 者 进行 试验 , 避免 低 效 或 无 价值 的 重复 试验 。 此 外 , 尽管 有 些 药物 
或 措施 可 能 不 会 显著 提高 疗效 , 但 其 副作用 发 生 率 或 者 成 本 下 降 , 也 应 优先 考虑 进行 试验 。 
(四 ) 选择 最 佳 治疗 水 平 的 终点 指标 
开价 治疗 效果 要 选择 合适 指标 , 这 些 指标 包括 终点 指标 和 中 间 指 标 。 终 点 指标 代表 疾病 的 
最 终结 局 , 如 某 些 肿瘤 外 科 手 术 或 化 疗 后 不 同时 期 的 存活 率 或 死亡 率 ; 中 间 指 标 是 指 疾病 发 展 
变化 过 程 中 的 一 些 结果 ， 如 药物 治疗 乙 型 肝炎 期 间 转 所 酶 的 变化 水 平 及 其 他 实验 室 指标 水 平 
等 。 治疗 终点 指标 的 选择 应 基于 疾病 的 性 质 、 病 损 程 度 、 治疗 后 机 体 的 病理 损害 和 生理 功能 状 
| 次 的 可 复 性 而 定 。 例 如 : 治疗 高 血压 病 的 目标 是 使 血压 下 降 到 最 佳 治疗 水 平 .防止 心 脑 肾 等 披 
| 器 官 损害 事件 发 生 。 
| (五 ) 明确 研究 中 伦理 问题 0 
在 临床 研究 中 , 所 有 以 人 为 对 象 的 研究 必须 符合 世界 医学 会 《赫尔辛基 宣言 》、 国 际 汪汪 
学 组 织 理事 会 (涉及 人 的 生物 医学 研究 国际 伦理 准则 》 的 相应 规定 , 即 公正 、 尊 重 人 格 、 力 求 使 
受 试 者 最 大 程度 受益 和 尽 可 能 避免 伤害 发 生 。 SA 
从 药物 临床 研究 设计 阶段 就 要 重点 考虑 伦理 问题 。 考 虑 以 下 8 方面 内 容 : 即 方 案 设计 与 实 
施 、 试 验 的 风险 与 受益 、 受 试 者 的 招 慕 、 知 情 同意 书 告知 的 信息 .知情 同意 的 过 程 、 受 试 者 的 医 
疗 和 保护 、 隐 私 和 保密 、 涉 及 弱势 群体 的 研究 等 。 
例如 在 开始 一 种 新 药 的 RCT 之 前 , 应 该 明确 RCT 的 设计 和 执行 方案 是 否 科学 ? 是 否 考虑 
受 试 对 象 的 收益 和 风险 比 ? 是否 确保 受 试 者 已 经 知情 同意 而 且 是 自愿 参与 ? 是否 可 以 随时 、 随 
。 地 地 自由 退出 试验 ”是 否 能 保护 受 试 者 的 秘密 ?是 否 能 迅速 发 现 和 处 理 不 良 事件 并 给 予 相应 
竺 记 党 ”| 的 补偿 或 者 赔偿 ? - 旦 有 更 好 的 治疗 方案 ,是 否 能 停止 RCT? 
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三 、 治 疗 性 研究 与 新 药 临床 试验 分 期 


治疗 性 研究 中 , 最 常见 的 研究 方案 是 临床 试验 ， 其 中 又 以 新 药 临床 试验 居多 。 按 照 新 药 的 
不 同 研发 阶段 , 药物 临床 试验 进一步 可 分 为 : 

(一 ) 工期 临床 试验 

I 期 临床 试验 为 初步 的 临床 药理 学 及 人 体 安全 性 评价 ， 是 在 大 量 实验 室 研究 、 试 管 实验 与 
动物 实验 基础 上 , 将 新 疗法 开始 用 于 人 类 的 试验 ， 是 在 人 体 进 行 新 药 试验 的 起 始 期 。 目 的 在 于 
了 解 剂量 反应 与 毒性 ， 进行 初步 的 安全 性 评价 , 研究 人 体 对 新 药 的 耐 受 性 及 药 代 动力 学 ， 了 解 
药物 在 人 体内 的 吸收 、 分 布 、 消 除 的 规律 , 以 提供 初步 的 给 药方 案 。 受 试 对 象 一 般 为 健康 志愿 
者 ,在 特殊 情况 下 也 选择 病人 作为 受 试 对 象 。 方 法 为 开放 、 基 线 对 照 、 随 机 和 盲 法 。 I 期 临床 试 
验 的 样本 量 为 20~30 例 。 

(二 ) 工期 临床 试验 

I 期 临床 试验 主要 对 新 药 的 有 效 性 、 安 全 性 进行 初步 评价 , 确定 给 药剂 量 。 一 般 采 用 严格 
的 随机 双 讶 对 照 试验 , 以 平行 对 照 为 主 。 通 常 应 该 与 标准 疗法 进行 比较 ， 也 可 以 使 用 安奈 剂 。 
需 注意 诊断 标准 .疗效 标准 的 科学 性 、 权 威 性 和 统一 性 。 要 根据 试验 目 的 选择 恰当 的 观测 指 
标 , 包括 诊断 指标 、 疗 效 指标 、 安 全 性 指标 。 选 择 指标 时 , 应 注意 其 客观 性 、 可 靠 性 、 灵敏 度 、 特 
异性 、 相 关 性 和 可 操作 性 。 参 照 临床 前 试验 和 I 期 临床 试验 的 实际 情况 制定 药物 的 剂量 研究 方 
案 。 应 有 符合 伦理 学 要 求 的 试验 中 止 标 准 和 退出 标准 。 对 不 良 事件 及 不 良 反应 的 观测 、 判 断 和 
及 时 处 理 都 应 作 具 体 规 定 。 应 有 严格 的 观测 、 记 录 及 数据 管理 制度 。 试 验 结束 后 , 对 数据 进行 
统计 分 析 , 对 药物 的 安全 性 .有 效 性 、 使 用 剂量 等 作出 初步 评价 和 结论 。I 期 临床 试验 的 试验 组 
和 对 照 组 的 例 数 都 不 得 低 于 100 例 。 

(三 ) 亚 期 临床 试验 

亚 期 临床 试验 为 扩大 的 、 多 中 心 随机 对 照 临床 试验 , 旨 在 进一步 验证 药品 的 有 效 性 和 安全 
性 , 评价 利弊 , 最 终 为 药物 注册 申请 的 审查 提供 充分 的 依据 。 可 根据 试验 目的 调整 受 试 者 的 人 
选 标准 , 适当 扩大 特殊 受 坛 人 群 , 进一步 考察 不 同 对 象 所 需 剂量 及 其 依从 性 。 亚 期 临床 试验 的 试 
验 组 例 数 一 般 不 低 于 300 例 , 对 照 组 与 治疗 组 的 比例 不 低 于 1:3, 具体 例 数 应 符合 统计 学 要 求 。 

(四 ) 区 期 临床 试验 

期 临床 试验 是 在 新 药 上 市 后 研究 , 旨 在 评估 药物 在 更 大 范围 .长 期 的 实际 应 用 中 的 疗效 
以 及 监测 不 良 反应 , 特别 是 罕 发 、 严 重 的 不 良 反 应 事件 。 此 外 , 还 应 进一步 考察 对 患者 经 济 水 
平 与 生存 质量 的 远 期 影响 。 了 期 临床 试验 应 在 多 家 医院 进行 , 观察 例 数 通常 不 少 于 2000 例 。 

临床 试验 的 样本 量 除 满足 上 述 最 低 标准 外 , 还 需要 同时 满足 统计 学 要 求 。 由 于 新 药 临床 试 
验 是 应 用 尚 在 研究 中 的 新 药 , 在 人 体 进行 的 安全 、 有 效 性 评价 , 故 研 究 者 对 受 试 者 的 安全 负 有 
重要 责任 。 因 此 需要 在 国家 批准 认证 的 药物 临床 试验 机 构 (GCP ) 进 行 。 





二 节 ”治疗 性 研究 的 设计 内 容 及 方法 
临床 治疗 性 研究 主要 包括 以 下 内 容 : 
一 、 确 立 研究 目的 及 研究 题目 
一 项 高 质量 的 临床 治疗 性 试验 , 必须 要 有 明确 的 研究 目的 。 基 于 研究 目的 明确 研究 方案 、 
设立 指标 、 方 法 及 统计 分 析 手 段 。 
在 上 一 节 已 涉及 临床 治疗 性 试验 的 选 题 问题 ,强调 先 题 应 具有 一 定 的 创新 性 。 题 目 可 以 来 
源 于 基础 研究 的 提示 , 也 可 以 是 动物 试验 结果 在 人 体 的 进一步 验证 , 更 多 的 是 来 源 于 临床 医生 | 
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的 实际 观察 和 总 结 以 及 来 自 对 人 群 流行 病 学 的 观察 和 研究 。 无 论 来 自 于 哪 一 方面 , 其 创新 性 、 
实用 性 和 可 操作 性 是 必 不 可 少 的 , 而 且 一 定 要 满足 伦理 学 要 求 。 

在 立 题 过 程 中 ,需要 关注 的 是 采用 什么 样 的 方法 、 策 略 和 技术 路 线 来 解决 所 发 现 的 问题 。 
不 要 和 匆忙 立 题 , 可 以 反复 酝酿 思考 , 并 且 最 好 让 合作 者 再 审查 、 评 价 , 进一步 把 握 研究 问题 的 内 
容 和 方向 , 以 保证 整个 研究 能 具有 连续 性 。 


二 、 选 择 研 究 方案 


治疗 性 研究 中 多 选择 试验 性 研究 方案 , 包括 随机 对 照 试验 、 非 随机 对 照 试验 、 历 史 性 对 照 
试验 、 自 身 前 后 对 照 试验 、 交 叉 对 照 试验 及 序 贯 试验 等 。 其 次 还 可 以 采用 非 试验 性 的 研究 方法 ， 
如 队列 研究 等 。 

(一 ) 试验 性 研究 方案 

治疗 性 研究 可 以 采用 的 试验 方案 种 类 主要 包括 随机 对 照 试验 ( randomized controlled trial, 
RCT)、 单 病例 随机 对 照 试验 (N of 1 RCTs)、 交 叉 对照 试 验 (cross-over design, COD)、 前 -后 对 昭 
试验 (before-after study)、 非 随机 对 照 试验 (non- randomized controlled trial, NRCT)、 历 史 性 对 照 试 
验 (historical control trial, HCT)、 序 贯 试验 (sequential trial ) 等 。 有 关 这 些 试验 方案 的 定义 、 特 点 
及 应 用 条 件 在 本 教材 第 四 章 中 已 有 详细 介绍 , 在 此 不 再 作 效 述 。 

(二 ) 非 试 验 性 设计 方案 

此 类 代表 性 方案 有 队列 研究 ( cohort study ) 和 病例 对 照 研究 ( case-control study ), 由 于 属于 
非 试验 性 研究 , 其 证 据 强度 要 弱 于 试验 性 的 研究 。 此 类 内 容 在 第 四 章 中 也 有 介绍 , 在 此 也 不 作 
叙述 。 

(三 ) 多 中 心 临床 试验 (mult-center clinical trial) 

指 由 一 个 或 几 个 单位 的 主要 研究 者 总 负责 , 多 个 单位 的 研究 者 合作 , 按 辐 一 方案 进行 的 临 
床 试 验 ; 各 中 心 同期 开始 与 结束 试验 , 具有 试验 时 间 短 、 研 究 范围 广 、 样本 代表 性 好 、 结 论 外 推 
性 强 等 特点 。 但 由 于 参与 研究 的 单位 和 人 员 较 多 ， 对 质量 控制 和 标准 化 有 更 高 的 要 求 , 同时 ， 
完成 试验 也 需要 较 多 研究 经 费 。 详 见 第 四 章 。 

(四 ) 社区 干预 试验 

是 以 社区 自然 人 群 作为 研究 对 象 , 在 现场 环境 下 进行 的 干预 研究 ,接受 干预 的 基本 单位 是 
整个 社区 , 或 某 个 人 群 的 各 个 亚 人 群 , 这 种 试验 常用 于 对 某 种 预防 措施 或 方法 (疫苗 、 药 物 等 ) 
的 效果 评价 。 














三 、 选 择 研究 对 象 

研究 对 象 首先 应 符合 公认 的 临床 及 有 关 金 标准 诊断 , 同时 根据 研究 目的 , 进一步 拟定 纳入 
标准 及 排除 标准 ,以 保证 人 选 对 象 具有 较 高 的 同 质 性 ,有 利于 减少 偏 倚 的 发 生 , 获得 较为 准确 
的 研究 结果 。 在 设置 排除 标准 时 , 应 特别 列 出 不 宜 使 用 该 药 的 人 群 ,如 心 、 肺 、 肝 、 肾 功能 不 全 
者 和 小 儿 、 孕 妇 、 哺 乳 期 妇女 等 ; 同时 对 该 类 药物 过 敏和 其 他 不 宜 参加 这 项 研究 者 , 如 依从 性 
差 、 参 与 了 其 他 药物 临床 试验 的 受 试 者 也 应 排除 。 但 要 注意 : 纳入 标准 的 制定 不 宜 过 严 , 排除 
标准 也 不 宜 过 多 , 否则 就 可 能 影响 研究 结果 的 外 推 性 及 适用 性 。 

除 上 述 要 求 外 , 还 应 确定 病例 的 来 源 , 包括 是 哪 一 级 医院 , 是 门诊 病人 还 是 住院 病人 。 此 
外 , 根据 医学 伦理 学 的 原则 , 凡 参 加 临床 试验 者 , 都 要 签署 知情 同意 书 。 

例如 : 某 一 新 型 抗生素 治疗 急性 细菌 性 感染 的 疗效 研究 中 , 设置 的 纳入 标 准 包括 : 年 龄 18~65 
岁 的 住院 或 门诊 患者 (慢性 支气管 炎 急 性 发 作 部 分 患者 年 龄 可 放宽 至 70 岁 )、 性 别 不 限 、 经 临床 
和 实验 室 检 查 确诊 为 细菌 感染 、 试 验 前 未 用 过 其 他 抗生素 治疗 或 经 其 他 抗生素 治疗 无 效 而 细菌 
学 检查 为 阳性 并 单独 用 此 药 治疗 者 、 签 署 了 知情 同意 书 的 受 试 者 。 并 同时 规定 了 排除 标准 : 如 


第 十 章 ”疾病 治疗 的 研究 、 评价 与 循 证 实践 《三 


对 抗生素 有 过 敏 史 者 ; 严重 心 、 肝 、 肾 功能 不 全 者 ; 有 精神 、 神 经 系统 疾患 以 及 晚期 肿瘤 患者 ; 
妊娠 .哺乳 期 妇女 ; 依从 性 差 或 病情 严重 , 不 能 完成 试验 者 等 。 


四 、 研 究 对 象 的 随机 化 分 配 及 设 盲 


符合 诊断 标准 、 纳 入 / 排除 标准 的 合格 受 试 者 一 旦 人 选 药物 临床 试验 , 需 进一步 实施 随机 
化 分 组 , 可 选择 的 随机 化 方法 , 包括 简单 随机 、 区 组 随机 、 分 层 随机 等 , 其 中 较为 常用 的 是 通过 
计算 机 产生 随机 序列 或 随机 数字 表 产生 随机 数字 。 

随机 分 配方 案 的 隐藏 (allocation concealment), 顾名思义 就 是 对 分 配方 案 设 育 , 使 研究 参与 
者 无 法 知晓 某 个 患者 所 接受 的 是 何 种 干预 方案 。 随 机 分 配 隐 藏 的 最 佳 方法 是 中 心 随机 化 , 如 将 
产生 的 随机 分 配 序列 号 用 信封 密封 。 

此 外 , 为 避免 临床 试验 中 的 测量 性 偏 傈 ,也 需要 设立 盲 法 。 根 据 设 盲 的 对 象 和 范围 , 可 分 

单 盲 临床 试验 (single blind method), 双 盲 临床 试验 (double blind method ) 和 三 育 临 床 试验 (triple 

blind method ), 其 中 以 双 盲 临床 试验 最 为 常用 。 


五 、 估 计 样 本 量 


通常 在 计算 样本 量 时 要 考虑 下 述 因素 : 
(一 ) 最 小 临床 效应 量 的 设 定 
样本 量 估算 首先 应 考虑 疗效 显著 性 差异 水 平 的 假设 , 确定 临床 最 小 效应 量 , 即 试验 组 与 对 
照 组 的 疗效 差异 多 大 才 有 实际 意义 或 临床 价值 。 计 数 资料 的 效应 量 表达 采用 试验 组 和 对 照 组 
疗效 率 的 差 值 , 计量 资料 则 为 试验 组 和 对 照 组 的 均值 差 值 。 

(二 ) I 型 (a) 错 误 和 [型 (8) 错误 的 水 平 

1. I 型 (ao) 错误” 即 试验 的 假 阳 性 错误 ,通常 限定 不 超过 0.05( 5% )。 该 型 误差 越 小 , 所 需 
要 的 样本 量 越 大 。 

2. I 型 (6) 错误 ” 即 试验 的 假 阴 性 错误 , 通常 限定 为 0.1, 不 宜 超 过 0.2。1 -6B 为 检验 效能 
(power), 又 称 把握 度 。1 一 6 越 大 , 要求 的 样本 量 也 越 大 。 

Re 总 体 率 天 或 标准 差 c 

本 含量 估计 时 , 对 于 计数 资料 , 还 需要 确定 总 体 率 ; 对 于 计量 资料 , 则 需要 估计 标准 差 ce 

人 ran 比较 根据 上 面 的 这 些 基本 设计 参数 , 应 用 式 ( 10-1) 计 算出 各 组 所 需 的 试验 样 

本 量 。 








m(100—x)+m(100—x,) 
= 一 -一 一 一- 


(zm—X) 


xf(a,p) 式 (10-1) 


其 中 为 一 个 组 的 样本 量 ; za, zt 为 试验 组 和 对 照 组 的 发 生 率 ; f(a, 8 ) 为 限定 假 阳性 和 假 阴 
性 水 平时 相应 的 参数 值 , 可 以 由 表 10-1 查 出 。 


表 10-1 常用 f(a, 8p) 数值 表 














B 
0.05 0.10 0.20 0.50 
0.10 10.8 8.6 6.2 py 
0.05 13.0 105 79 3.8 
0.02 15.8 13.0 10.0 5.4 
0.01 17.8 149 11.7 6.6 


例如 : 用 两 种 药物 对 糖尿 病 患 者 进行 康复 治疗 , 经 初步 观察 发 现 , 甲 药 的 有 效率 为 70% , 乙 
药 的 有 效率 为 90% , 现 要 进一步 试验 , 设 x=0.05,8=0.1, 问 每 组 至 少 需要 观察 多 少 病例 ? 











车 记 
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已 知 z=70%, zs=90%,a=0.05,B=0.10, 查 表 10-1 得 ,f(0.05,0.1)=10.5, 代入 上 述 公 
式 得 : 
,70x(100-70)+90x(100-90) 





x 10.5=79, 即 每 组 需 观 察 79 个 病例 。 


(90—70)? 
2. 两 组 均 数 的 比较 ”在 进行 两 个 样本 均 数 比较 的 研究 中 , 其 样本 量 估 计 可 采用 式 (10-2)。 
nn 式 (10-2) 


此 式 中 的 n,、ns 分 别 为 1 组 .2 组 的 样本 量 ,一 般 是 相等 的 ,5 为 两 总 体 标准 差 o 的 估计 值 ， 
一 般 假 设 其 相等 或 取 合并 方差 的 平方 根 ,6 为 两 均 数 的 差 值 , 即 最 小 效应 量 的 估计 , t。 和 1 分 别 
为 检验 水 准 a 和 第 型 错误 的 概率 8 相对 应 的 1 值 , 可 以 通过 查 1 值 表 得 到 。 

例如 : 观察 两 种 药物 治疗 肌 痉 挛 的 疗效 , 其 中 B 药 使 肌 痉 挛 分 数 平均 减少 2.16, 工 药 使 肌 痉 
挛 分 数 平均 减少 1.66, 设 两 种 药物 疗效 的 标准 差 相等 , 均 为 0.7 分 , 要求 xc= 0.05,8= 0.1, 若 要 得 
出 两 组 处 理 差 别 有 显 著 性 结论 , 需要 多 少 研究 对 象 ? 

已 知 : 6=2.16-1.66=0.5,S=0.7, 双 侧 a=0.05, B=0.1, 查 + 值 表 得 : om,==1.96, 加 .==1.28， 
代入 公式 得 : 

i -m=2| 95+ 20*07 | -412-42( 便 

故 认为 两 组 各 需 42 例 患 者 , 共计 84 例 。 

在 实际 工作 中 , 可 以 采用 下 述 公 式 进行 计算 , 较为 方便 。 

n=26xf(a, BP)/(p2 -pu ) 式 (10-3) 

为 每 组 所 需 的 例 数 ,yy', pv 分 别 为 两 组 的 预期 均 数 ,5 为 两 组 的 合并 标准 差 或 对 照 组 的 标 
准 差 ,f(a,) 可 由 表 10-1 中 查 出 。 用 此 公式 计算 结果 相同 。 

考虑 试验 中 出 现 的 病例 失 访 和 退出 情况 , 故常 在 计算 量 的 基础 上 增加 10%。 

此 外 , 在 实际 工作 中 还 可 以 根据 不 同 研究 方案 的 特点 调整 样本 量 , 如 非 劣 效 性 试验 和 等 效 
性 试验 , 所 需 样本 量 应 适当 增加 。 新 药 审 批 办 法 中 虽 已 明确 规定 了 新 药 临床 试验 的 病例 数 要 
求 , 但 也 应 同时 满足 统计 学 要 求 , 需要 估计 样本 量 。 


六 、 选 择 试验 药物 或 措施 
试验 药物 或 措施 首先 要 保证 其 有 效 性 和 安全 性 , 并 同时 具有 一 定 的 创新 性 和 经 济 性 。 对 照 
组 药物 , 无 论 是 阳性 对 照 药物 还 是 安奈 剂 , 在 外 观 、 色 泽 等 方面 应 与 试验 组 药物 相似 , 同时 服用 
方法 和 疗程 也 要 一 致 , 否则 会 影响 结果 的 真实 性 。 


七 、 选 择 试验 疗效 和 安全 性 测试 指标 


临床 试验 中 应 采用 某 种 测量 方法 和 指标 来 度量 药物 或 干预 措施 所 呈现 的 治疗 效应 , 包括 疗 
效 及 药物 不 良 反应 等 , 所 设置 的 测试 指标 应 满足 以 下 要 求 : 

1. 灵敏 度 要 好 ”对 于 治疗 引起 的 客观 反应 , 测试 指标 要 能 敏感 地 发 现 并 能 度量 。 例 如 : 采 
用 胆 碱 酷 酶 抑制 剂 抗 痴呆 治疗 , 如 果 应 用 临床 痴呆 分 级 表 , 其 敏感 性 要 比 阿尔 茨 海 默 评估 量 表 
认 知 副 表 要 差 得 多 , 如 用 前 者 测量 治疗 反应 , 必然 大 大 增加 假 阴 性 率 , 所 以 测试 指标 和 方法 的 
灵敏 度 越 高 越 好 。 

2. 特异 度 要 强 “ 测试 方法 和 指标 除了 敏感 之 外 还 要 特异 。 例 如 , 溶 检 疗 法 治疗 急性 心肌 
梗死 , 在 治疗 前 后 采用 冠 脉 造影 , 比较 分 析 冠 脉 狭窄 和 闭塞 改善 的 程度 , 车 以 此 作为 疗效 的 测 
量 指标 , 则 特异 性 强 , 有 助 于 疗效 的 判定 。 
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3. 针对 性 要 佳 ” 测 试 指标 的 选择 应 充分 考虑 试验 的 终点 目标 。 如 治疗 的 终点 目标 是 降低 
病死 率 和 非 致死 事件 发 生 , 则 测试 指标 定 为 病死 率 、 生存 率 以 及 非 致 死 事件 发 生 率 ( 如 冠 心病 发 
生 心 肌 梗死 、 心 衰 等 )。 若 验证 治疗 措施 本 身 的 有 效 性 , 则 采用 临床 公认 的 有 效 或 无 效 的 判断 标 
准 , 精 选 有 关 临 床 及 实验 室 的 定量 及 定性 指标 予以 测量 。 如 用 血压 计 测量 降 压 效果 , 用 血糖 评 
价 糖 尿 病 降 糖 效果 等 。 

4. 指标 数量 要 适当 指标 设置 要 少 而 精 , 测试 指标 越 多 , 假 阳 性 的 发 生 概 率 就 越 大 , 有 时 
甚至 会 左右 研究 结论 。 

5. 远 期 效应 指标 要 优先 ”对 于 某 些 慢 性 病 的 疗效 评价 , 除 测试 和 评价 近期 效应 外 , 还 要 追 
踪 观 察 远 期 效果 , 这 样 更 有 助 于 临床 决策 。 例 如 , 高 血压 患者 的 治疗 不 仅 要 观察 用 药 后 血压 的 
控制 水 平 , 而 且 更 要 观察 高 血压 所 致 的 心 、 脑 、 肾 不 良 事件 的 发 生 情 况 。 

6. 经 济 可 行 性 ”测试 方法 和 指标 除了 要 考虑 敏感 性 和 特异 性 外 , 还 要 注意 这 些 指标 的 经 济 
可 行 性 。 如 评价 输卵管 堵塞 病人 的 复 通 效 果 , 可 选用 输卵管 子宫 碘 油 造影 或 腹腔 镜 下 通 亚 甲 蓝 
等 两 种 方法 , 这 些 方 法 的 敏感 度 和 特异 度 均 较 高 , 但 前 者 更 为 经 济 且 操作 相对 简便 , 对 病人 的 
创伤 小 , 故 应 优先 考虑 。 

7. 指标 设置 要 全 面 ”在 药物 临床 试验 中 , 除了 有 效 性 指标 外 , 安全 性 指标 同样 重要 , 主要 
包括 一 些 症状 、 体 征 、 实 验 室 检查 指标 。 选 用 时 应 根据 试验 目的 、 内 容 而 定 。 


八 、 确 定 干预 实施 方法 及 随访 观察 期 


详细 说 明 试 验 干 预 方法 和 实施 要 求 , 建立 试验 药物 包装 、 分 发 、 转 运 、 供 应 档案 。 设 立言 法 
时 , 则 有 保证 言 法 的 具体 措施 , 以 及 当 患 者 病情 恶化 或 突 发 不 良 事件 , 有 紧急 破 盲 的 操作 规范 ; 
同时 还 要 建立 避免 沾染 和 干扰 以 及 保证 依从 性 的 制度 等 。 

临床 试验 中 同样 需要 确立 一 个 明确 的 随访 观察 期 , 观察 期 要 适当 、 不 宜 过 长 或 过 短 。 过 长 
会 造成 不 必要 的 浪费 ,过 短 则 可 能 会 无 法 观察 到 一 些 远 期 效果 。 观 察 期 的 确定 应 基于 研究 目 
的 .前 期 基础 研究 结果 以 及 临床 达到 治疗 最 佳 水 平 所 需 时 间 等 。 如 骨 质 疏松 的 防治 性 研究 应 考 
虑 到 骨 代 谢 的 周期 较 长 , 少 于 1 年 很 难得 出 结果 。 


九 、 整 理 分 析 试 验 结果 


与 其 他 研究 一 样 , 临床 试验 也 需 在 原始 资料 完整 、 准 确 的 基础 上 , 按 研究 目的 、 试 验 设计 方 
案 , 以 及 资料 类 型 选择 正确 的 统计 方法 处 理 资料 。 内 容 包括 : 详细 列 出 主要 和 次 要 指标 的 分 析 
方法 、 亚 组 分 析 方 法 ; 详细 比较 进入 试验 组 和 对 照 组 病人 的 基线 特征 , 以 及 失 访 、 退 出 和 脱落 病 
例 的 情况 ; 在 分 析 中 如 何 处 理 偏 倚 和 缺失 数据 , 如 何 解释 结果 的 意义 ; 如 实 报告 试验 结果 的 有 

(一 ) 资料 的 整理 

对 获得 的 原始 记录 包括 病历 观察 表 、 临床 化 验 及 各 种 功能 检查 结果 要 进行 核查 , 然后 通 
过 计算 机 建立 数据 库 、 双 输 双 录 所 有 的 资料 。 对 于 可 疑 的 数据 可 以 下 达 数 据 质疑 表 , 经 修正 后 
再 次 修订 数据 库 。 当 所 有 的 修订 完成 后 , 锁定 数据 库 。 

(二) 统计 方法 的 选择 

1. 根据 资料 的 性 质 采用 相应 的 统计 学 方法 

(1) 治疗 性 研究 资料 中 最 常见 的 是 计数 资料 与 计量 资料 和 等 级 资料 。 计 数 资料 的 描述 采用 
率 和 比 , 如 有 效率 、 治 愈 率 、 病 死 率 等 ,假设 检验 方法 为 卡 方 检验 (x test); 计量 资料 的 描述 常用 
均 数 土 标准 差 , 假设 检验 常用 + 检验 (小 样本 ),w 检 验 (大 样本 ) 及 下 检验 (多 因素 方差 分 析 )、 非 
参数 检验 等 ; 等 级 资料 是 将 某 一 指标 划分 为 若干 等 级 , 常用 Ridit 分 析 及 非 参 数 检验 等 。 

(2) 如 治疗 性 研究 本 身 有 两 组 以 上 组 别 比 较 , 必须 先 作 多 组 间 的 显著 性 检验 , 差异 有 统计 学 
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意义 时 , 才能 进一步 作 两 两 比较 。 

(3 ) 治疗 性 研究 设计 可 以 是 配对 设计 , 或 完全 随机 设计 。 两 种 设计 的 原理 不 同 , 分 析 处 理 
的 方法 也 不 同 , 二 者 不 可 混淆 。 

2. 根据 分 析 目 的 选用 统计 方法 

(1) 治疗 效果 的 多 因素 分 析 : 任何 治疗 效果 的 产生 , 除了 治疗 措施 本 身 的 效力 之 外 , 还 与 患 
者 人 文 特征 以 及 病理 生理 状态 、 疾 病 特点 等 有 关 。 例 如 年 龄 营养 状态 、 病 情 、 药 量 、 疗 程 、 并 发 
症 、 合 并 症 等 , 均 会 影响 治疗 反应 。 为 此 , 应 在 单 因素 分 析 的 基础 上 , 选择 具有 显著 意义 的 有 关 
变量 作 多 因素 分 析 , 进一步 评价 疗效 。 

(2) 单 侧 检验 或 双 侧 检验 : 如 肯定 试验 药 (或 措施 ) 疗 效 优 于 对 照 药 (或 措施 ), 则 用 单 侧 检 
验 法 ; 若 不 能 肯定 , 则 采用 双 侧 检验 法 。 如 果 对 照 组 用 阳性 对 照 药 物 , 则 需要 进行 非 劣 效 性 检 
验 , 此 时 用 单 侧 检验 即 可 。 

(3) 对 不 完整 资料 的 处 理 与 分 析 : 对 于 在 研究 中 出 现 退出 、 失 访 的 情况 , 除了 采用 按 方案 分 
析 (per-protocol analysis, PP) 之 外 , 还 可 以 采用 意向 治疗 分 析 (intention to treat analysis , ITT js HT 
分 析 是 将 所 有 纳入 随机 分 配 的 病人 , 不 管 最 终 是 否 接受 到 分 配 的 治疗 , 在 最 后 资料 分 析 中 都 应 
按 随机 分 配方 案 统计 , 以 保证 结论 更 真实 可 靠 。 


第 三 节 ”治疗 性 研究 质量 的 常见 影响 因素 及 其 处 理 方法 


治疗 性 研究 中 存在 很 多 影响 结果 真实 性 和 可 靠 性 的 因素 , 如 常见 的 偏 倚 和 机 遇 因 素 等 , 车 
不 加 以 识别 和 控制 ,临床 研究 结果 将 会 失真。 


一 、 机 “ 遇 


机 遇 (chance) 即 随机 误差 或 抽样 误差 。 机 遇 因 素 在 治疗 性 研究 中 不 可 能 消除 , 只 能 在 研究 
设计 阶段 , 通过 限制 I 型 错误 率 和 IT 型 错误 率 , 使 机 遇 因素 的 影响 控制 在 容许 范围 之 内 。 


二 . 偏 倚 


除 常 见 的 选择 偏 倚 (selection bias )、 测 量 偏 倚 (measurement bias ) 和 混杂 偏 倚 (confounding 
bias ) 外 ,还 存在 一 些 临 床 研究 特有 偏 倚 。 

(一 ) 选择 偏 倚 

该 偏 倚 主 要 产生 在 设计 阶段 , 入选 研究 对 象 与 未 人 选 者 在 某 些 特征 上 存在 系统 差别 , 同时 
除 研究 因素 以 外 的 其 他 因素 组 间 分 布 也 不 均衡 ,导致 研究 结果 出 现 偏差 。 选 择 偏 倚 可 以 通过 随 
机 、 设 立 对 照 、 严 格 纳入 /排除 标准 等 方法 加 以 控制 。 

(二 ) 测量 偏 倚 

测量 性 偏 倚 指 在 资料 的 观察 ,测量 及 收集 过 程 中 , 由 于 受到 人 为 因素 的 影响 导致 结果 失真 
的 一 类 偏 倚 。 通 过 实施 盲 法 ,标准 化 测量 、 提 高 应 答 率 等 方法 可 以 防止 这 类 偏 倚 的 发 生 。 

(三 ) 混杂 偏 倚 

混杂 偏 倚 是 指 由 于 混杂 因素 的 存在 ,掩盖 或 压 大 了 研究 因素 与 疾病 间 的 关联 度 。 可 以 通过 
限制 、 配 比 、 随 机 、 标 准 化 ,分 层 及 多 因素 分 析 方 法 加 以 控制 。 

(四 ) 特殊 偏 倚 

在 临床 治疗 性 研究 中 还 存在 一 些 特殊 偏 倚 , 在 本 质 上 属于 测量 性 偏 倚 , 主要 包括 以 下 几 种 ， 

1. 霍 又 效应 ( Hawthorne effect) 霍 桑 效应 是 指 在 研究 过 程 中 , 研究 者 对 自己 感 兴趣 的 研究 
对 象 较 对 照 者 往往 更 为 关照 和 仔细 ; 而 被 关照 的 患者 对 研究 人 员 又 极 可 能 报 以 过 分 的 热情 ,更 
多 地 向 医生 报告 好 的 结果 。 这 种 人 为 地 夸大 客观 效果 的 现象 , 称 为 “ 霍 又 效应" 。 控 制 截 又 效 应 
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的 最 好 方法 是 严格 实施 盲 法 。 

2. 干扰 (co-intervention) 干扰 是 指 试验 组 或 对 照 组 的 对 象 额外 地 接受 了 类 似 试验 药物 的 
某 种 有 效 制剂 , 从 而 人 为 地 夸大 了 疗效 的 假象 。 如 果 是 试验 组 的 对 象 接 受 了 “干扰 ”药物 , 则 会 
造成 疗效 提高 , 从 而 引起 试验 组 与 对 照 组 疗效 差异 的 增 大 ; 反之 , 如 果 是 对 照 组 的 对 象 接受 了 
“和 干扰" 药物, 则 可 引起 对 照 组 疗效 率 增高 而 使 组 间 疗 效 差异 减 小 。 最 好 的 控制 方法 就 是 实施 规 
范 化 试验 及 改善 依从 性 , 尽 可 能 减少 其 他 药物 的 使 用 。 

3. 沾染 (contamination) 沾染 是 指 对 照 组 患者 额外 地 接受 了 试验 组 的 药物 , 人 为 地 夸大 了 
对 照 组 疗效 的 现象 。 在 试验 设计 时 应 该 加 以 限制 并 在 试验 过 程 中 加 强 质 量 控制 , 改善 依从 性 。 

4. 向 均 数 回归 现象 (regression to the mean) 有 些 测试 指标 如 血压 或 某 些 生化 指标 在 初试 
时 有 些 患 者 可 以 在 异常 水 平 ,然而 , 在 未 干预 或 无 效 治疗 的 条 件 下 复试 , 可 能 有 些 回 复 到 正常 
水 平 。 这 种 现象 或 许 属 生 理性 波动 , 而 非 干 预 的 结果 ,但 可 造成 治疗 有 效 的 假象 。 克 服 的 办 法 
是 可 以 采取 对 同一 个 体 的 有 关 测 试 指标 在 相同 条 件 下 , 不 同时 间 内 多 次 测定 , 取 均 值 以 排除 其 
干扰 。 

5. 失 访 ” 当 大 量 病 人 失 访 时 ,研究 也 可 以 产生 与 结局 测量 有 关 的 偏 倚 。 因 为 失 访 病人 如 
果 有 不 同 的 事件 发 生 率 , 仅仅 依靠 随访 到 的 病人 的 数据 资料 将 会 得 到 与 真实 情况 不 同 的 结果 。 
克服 的 方法 是 提高 随访 率 或 者 采用 ITT 分 析 。 

6. 依从 性 (compliance) 是 指 研究 对 象 按照 研究 设计 要 求 执行 医嘱 的 客观 反应 的 程度 。 全 
面 认真 地 执行 医嘱 , 按 规定 的 药物 剂量 和 疗程 接受 治疗 , 称 为 依从 性 好 ; 反之 则 为 依从 性 不 好 
或 不 依从 (non-compliance )。 依 从 性 差 的 原因 包括 : 简单 的 遗忘 、 误 解 药物 使 用 方法 、 不 能 耐 受 
药物 的 副作用 、 讨 厌 服药 或 费用 不 足 等 。 治 疗 时 间 长 (如 几 个 月 ) 或 治疗 方案 复杂 对 依从 性 也 有 
较 大 的 影响 。 

解决 依从 性 问题 最 主要 的 方法 是 使 病人 充分 理解 试验 目的 、 要 求 及 参加 这 项 试验 的 意义 ， 
使 病人 在 理解 的 基础 上 给 予 合 作 。 此 外 , 还 必须 同时 加 强 试验 工作 的 管理 , 从 客观 上 减少 不 依 
从 的 可 能 性 。 如 建立 检查 制度 , 在 复诊 时 计算 患者 的 依从 性 , 见 式 (10-4), 如 服药 量 >80%, 则 依 
从 性 佳 , < 80% 为 依从 性 不 佳 。 为 了 保证 研究 质量 , 不 依从 率 应 力争 控制 在 10% 范围 内 。 同 时 
还 应 建立 药物 、 血 、 尿 浓度 的 检测 方法 , 必要 时 可 进行 体液 内 药物 浓度 测定 来 确保 病人 的 依从 
性 。 另 外 , 选用 高 危 人 群 作 研究 对 象 对 提高 依从 性 也 很 有 意义 。 

依从 性 = 实际 用 药 量 (应 服药 量 - 复诊 时 剩余 药 量 ) 
总 设计 用 药 量 (应 服药 量 ) 

患者 的 依从 性 程度 对 研究 的 质量 会 有 很 大 的 影响 。 依 从 性 越 高 , 治疗 组 和 对 照 组 间 的 差异 
越 能 反映 治疗 的 真正 效果 。 而 依从 性 降低 就 不 可 能 获得 预期 效果 , 使 本 来 应 该 有 的 治疗 效果 消 
失 或 降低 。 所 以 在 治疗 性 试验 中 , 维持 与 改善 患者 的 依从 性 是 十 分 重要 的 。 
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第 四 节 ”治疗 性 研究 的 评价 原则 


治疗 性 研究 结果 只 有 通过 科学 地 评价 才能 区 别 措施 的 利弊 以 及 决定 能 否 用 于 临床 实践 。 
无 论 是 单个 原始 研究 评价 还 是 系统 综述 或 meta 分 析 等 二 次 研究 评价 , 都 可 以 概括 为 内 在 真实 
性 (internal validity )、 重 要 性 (importance)、 适 用 性 (applicability ) 三 个 方面 。 


一 、 单 个 原始 研究 评价 


(一 ) 真实 性 评价 
1. 治疗 性 研究 是 否 为 真正 的 随机 对 照 试验 ”随机 对 照 试 验 的 设计 要 求 最 为 严格 , 结果 的 
真实 性 优 于 其 他 设计 方案 。 这 是 因为 设计 严谨 的 RCT 可 有 效 地 控制 已 知 或 未 知 的 偏 倚 的 干扰 ， 
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确保 研究 结果 真实 可 靠 ， 故 为 治疗 性 研究 的 人 金 方案 。 在 评价 RCT 时 要 考虑 以 下 问题 : 四 是 否 采 


用 了 真正 的 随机 方法 ， 是 否 交代 了 具体 的 随机 方法 ,是 否 实施 随机 分 配 隐匿 ,是 随机 还 是 随意 。 
对 于 分 层 随机 对 照 试验 ， 要 注意 分 层 因素 的 数量 、 试 验 组 与 对 照 组 的 样本 量 及 分 层 后 各 亚 组 的 
病例 分 布 是 否 一 致 。@ 是 否 采用 了 育 法 ,要 注意 是 否 交代 了 具体 的 “ 盲 "法, 实施 的 是 单 育 、 双 
育 或 三 页, 阁 明 试验 过 程 是 否 按 言 法 操作 等 。@ 组 问 基线 状态 的 可 比 性 如 何 , 要 注意 是 否 描述 
了 组 间 基 线 的 状态 并 作 了 比较 , 如 果 存在 组 间 基 线 状态 的 不 一 致 性 , 则 要 注意 是 否 作 了 分 层 比 
较 或 校正 。 他 伴随 的 辅助 治疗 是 否 对 结果 有 影响 , 在 某 些 较为 复杂 疾病 的 治疗 性 研究 中 , 有 时 
是 在 “基础 治疗 " 的 基础 上 进行 试验 干预 的 ， 或 许 在 试验 中 某 些 病例 出 现 新 征 候 需要 辅 以 相关 的 
临时 用 药 。 因 此 ,组 间 的 辅助 或 基础 治疗 , 应 注意 差异 , 此外, 还 要 注意 考证 有 无 “干扰 " 及" 沾 
染 ” 的 影响 。 


如 果 结果 是 来 源 于 非 RCT 研究 , 则 应 对 文献 进行 分 析 与 评价 , 以 获取 优质 的 证 据 。 同 时 还 
要 考虑 其 他 的 注意 问题 。 

2 所 有 纳入 的 研究 对 象 是 否 随访 完整 》 研 究 对 象 随访 时 间 是 否 足够 “任何 观察 病例 的 委 
和 失 , 者 会 直接 影响 最 后 的 结果 和 证 据 的 真实 性 。 例 如 , 疗效 差 的 患者 退出 ,会 导致 治疗 效果 高 
入; 车 个 别 患 者 因 药 物 或 者 干预 措施 的 副作用 从 治疗 组 中 退出 , 可 能 会 低估 药物 的 危害 性 。 理 
想 的 情况 是 所 有 纳入 的 研究 对 象 在 研究 过 程 中 都 没有 失 访 , 但 这 一 点 在 实际 临床 研究 中 是 很 难 
保证 的 。 

失 访 率 一 般 应 控制 在 10% 以 内 , 若 超过 20%, 研 究 质量 会 受到 很 大 影响 , 结果 也 许 会 不 真 
实 。 对 于 一 般 失 访 率 影响 的 估计 ,常用 的 方法 是 将 试验 组 全 部 失 访 的 病例 , 均 计算 在 本 组 无 效 
病例 中 , 对照 组 丢失 的 病例 全 部 计 和 人 有效 病 例 内 。 如 果 仍 然 与 原 有 效 结论 一 致 , 则 可 以 接受 原 


来 的 结果 。 


同时 , 应 该 确保 随访 期 足够 长 , 以 保证 获得 重要 的 临床 效应 结果 。 随访 的 具体 时 间 取决 于 
目标 疾病 的 病程 特点 , 通常 临床 观察 的 疗程 至 少数 月 , 有 的 甚至 需要 1 年 以 上 方 能 充分 显示 防 
治 措施 的 重要 效果 。 

3 是 否 对 随机 分 组 的 所 有 研究 对 象 进行 了 分 析 (是 否 采 用 意向 治疗 分 析 ) 被 随机 分 配 人 
组 的 病例 可 因为 各 种 原因 出 现 失 访 。 例 如 , 因 副作用 发 生出 现 中 途 停 药 者 ; 患者 依从 性 差 而 未 
认真 按 医嘱 服药 者 以 及 发 生 沾染 或 者 干扰 者 等 。 如 果 这 部 分 研究 对 象 不 被 纳入 结果 分 析 , 必然 
影响 原来 的 随机 化 原则 和 基线 的 可 比 性 , 最 终 影 响 结果 的 真实 性 。 目 前 广泛 采用 意向 性 治疗 分 
析 进 行 资料 分 析 , 即 按 最 初 随机 分 配 入 组 的 全 部 病例 , 无 论 其 是 否 接受 或 未 接受 确切 的 治疗 药 
物 ,都 纳 人 进行 最 后 分 析 。 

4. 是 否 对 研究 对 象 、 医 生 和 研究 人 员 实施 了 盲 法 在 治疗 性 资料 的 收集 过 程 中 往往 也 会 产 
生 较 大 的 测量 性 偏 倚 。 如 受 试 研究 对 象 知道 自己 接受 的 是 治疗 措施 、 还 是 对 照 措施 ; 研究 者 或 
结果 测量 者 知道 研究 对 象 的 分 组 情况 , 往往 会 夺 大 研究 药物 的 效应 等 。 实 施 盲 法 的 目的 就 是 为 
了 减少 测量 性 偏 倚 以 维护 观察 结果 的 真实 性 。 育 法 可 以 是 单 言 `, 双 盲 或 三 言 。 

对 于 无 法 实施 盲 法 的 试验 (如 外 科 手术 ), 可 以 请 另外 的 医生 采用 客观 指标 评价 治疗 效果 。 
若 使 用 临床 记录 , 则 应 去 除 所 有 可 能 涉及 破 言 的 治疗 措施 的 信息 , 以 保证 真正 的 采用 了 盲 法 。 

5. 除 试验 方案 不 同 外 , 各 组 患者 接受 的 其 他 治疗 方法 是 否 相同 如 果 研究 对 象 除了 接受 规 
定 的 治疗 方案 外 , 还 有 意 或 无 意 采用 了 其 他 的 具有 类 似 作用 的 干预 措施 , 必然 影响 结果 的 真实 
性 。 沾 染 和 干扰 即 是 常见 的 两 种 情况 。 前 者 是 指 对 照 组 的 患者 接受 了 试验 组 的 防治 措施 , 使 得 
试验 组 和 对 照 组 间 的 疗效 差异 减 小 ; 后 者 是 指 试验 组 或 对 照 组 接受 了 类 似 试验 措施 的 其 他 处 
理 , 人 为 扩大 或 减 小 组 间 疗 效 的 真实 差异 。 

如 果 一 项 随机 对 照 试验 不 符合 上 述 五 条 标准 的 一 条 或 多 条 , 则 需要 考虑 其 研究 结果 的 真 
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(二 ) 重要 性 评价 

对 于 治疗 性 证 据 的 重要 性 评价 应 注重 两 个 方面 ， 即 正面 的 有 效 性 和 负面 的 不 良 反应 , 只 有 
疗效 佳 、 负 效 小 者 方 有 临床 价值 。 同时 还 要 分 析 其 精确 度 。 

1. 治疗 性 证 据 的 效应 强度 大 小 

(1) 疗效 强度 : 疗效 的 强度 通常 用 率 表示 ， 即 有 效率 、 治 愈 率 、 病 死 率 、 病 残 率 , 即使 有 些 计 
量 的 疗效 指标 , 亦 多 转换 为 “有 效率 " 等。 

当 对 RCT 各 组 的 有 效率 进行 比较 分 析 时 ， 可 以 采用 统计 学 方法 判定 各 组 间 差异 的 显著 性 
然而 , 仅仅 采用 这 些 " 率 ” 对 临床 量化 其 重要 程度 的 表达 是 不 足 的 。 近 些 年 来 , 随 着 临床 流行 
病 学 与 循 证 医学 的 发 展 ， 一 此 能 够 更 好 反映 临床 意义 的 试验 结果 指标 被 广泛 应 用 , 主要 有 以 下 
几 种 : 

1) 相对 危险 降低 率 (relative risk reduction， RRR) 

RRR= CER— EER 
CER 

注 : CER = control event rate( 对 照 组 事件 率 ); EER=experiment event rate( 试 验 组 事件 率 )。 

2) 绝对 危险 降低 率 (absolute risk reduction， ARR) 

ARR= CER— EER 式 (10-6) 

3) 需 治 疗 多 少 病 例 数 才 获得 一 例 好 结果 (number need to treat, NNT) 

1 


二 一 式 (10-7) 
ARR 


式 (10-5) 





5.7% —4.3% 
2 5%, ARR=5.7% -4.3%=1.4%, NNT= =72 


5.7% 1.4% 


不 良 反 应 往往 较 对 照 组 为 显著 , 也 许 还 可 能 发 生 较 重 的 药物 不 良 反 应 (ADR)。 因 此 , 在 分 析 和 
评价 治疗 性 证 据 时 , 要 注意 不 良 反应 的 各 组 发 生 率 、 种 类 及 其 强度 , 如 同 分 析 评价 正面 疗效 一 
样 ,进一步 测试 : 

1) 相对 危险 增加 率 (relative risk increase， RRI) 








ee 式 (10-8) 
EER 
2) 绝对 危险 增加 率 (absolute risk increase, 4R7): 
ARI= EER— CER 式 (10-9) 
3) 需 治 多 少 病例 才 发 生 一 例 不 良 反 应 (the number needed to harm, NNH) 
1 
DMN 式 (10-10) 
例如 : 上述 他 汀 RCT, 试验 组 不 良 反应 率 0.05%, 对 照 组 0.03%, 则 该 研究 之 不 良 反 应 的 : 
0.05%—0.03% 
= 一 一 一 -一 一 一 =40%,4RT=0.05% 一 0.03%=0.02% ,NMN 末 = =5000 


有 0.02% 
由 此 可 以 看 出 , 他 汀 治疗 的 不 良 反应 发 生 率 很 低 , 相对 而 言 是 较为 安全 的 。 
2. 治疗 性 结果 的 精确 度 “ 研 究 中 采用 的 各 相关 指标 , 仅 表示 着 它们 效应 强度 的 大 小 , 如 
有 效率 80% 以 及 4RR、RRR、NNT 的 值 等 。 但 效应 量 的 精度 往往 会 因 不 同样 本 量 大 小 而 有 所 差 
异 。 因 此 ， 应 进一步 评估 效应 的 精确 度 (precise )。 








人 
人 A 
笔记 
二 py 
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通常 采用 95% 的 可 信 区 间 (95% C7), 其 波动 范围 代表 结果 的 精确 程度 , 95% C7 值 的 范围 越 
罕 则 越 精确 。 

(三 ) 适用 性 评价 

上 述 证 据 的 真实 性 与 重要 性 经 分 析 和 评价 获得 肯定 结论 之 后 , 紧 接 着 要 考虑 这 种 有 价值 的 
证 据 是 否 可 被 应 用 于 临床 实践 ,需要 结合 自己 病人 的 实际 情况 , 评价 它 的 适用 性 。 通 常 考虑 以 
下 几 条 规则 : 

1. 被 评价 的 证 据 是 否 与 病人 情况 不 符 而 不 能 应 用 

(1) 整体 证 据 : 任何 治疗 性 研究 所 产生 的 有 价值 的 证 据 , 应 该 审查 疾病 的 诊断 标准 是 否 可 
靠 , 证 据 中 的 研究 对 象 之 纳 和 人 标准 是 否 与 拟 引证 的 病人 相符 , 其 生理 功能 与 病理 学 的 依据 、 病 
情 特点 、 年 龄 ,性 别 以 及 社会 经 济 状况 是 否 存在 显著 差异 等 , 假若 以 上 特点 一 致 或 大 体 一 致 , 则 
该 治疗 性 证 据 就 认为 适用 , 否则 就 不 可 取 。 

(2) 亚 组 证 据 : 有 的 证 据 在 总 体 上 可 能 缺乏 适用 性 , 但 其 亚 组 分 析 的 疗效 可 能 有 显著 意义 ， 
如 果 患 者 的 病情 与 某 亚 组 患者 的 病情 相似 , 那么 , 这 个 亚 组 的 治疗 证 据 就 有 适用 的 价值 。 

对 于 有 着 显著 适用 的 亚 组 分 析 证 据 , 如 能 符合 下 述 条 件 者 , 则 有 应 用 价值 : 

1) 确 有 生物 学 和 临床 依据 者 ; 

2) 确 有 统计 学 意义 和 临床 价值 者 ; 

3 ) 亚 组 分 析 在 研究 设计 阶段 就 已 拟定 , 而 不 是 在 试验 结束 后 有 意 为 之 ; 

4) 仅 属 该 研究 中 有 限 几 个 亚 组 分 析 的 证 据 之 一 者 (注意 亚 组 不 能 设置 过 多 ); 

和 次 证 据 在 另外 的 研究 中 可 被 证 实 者 。 

2. 拟 采 用 的 治疗 证 据 是 否 可 以 在 本 单位 医疗 条 件 下 采用 ”对 于 拟 采 用 的 有 效 治疗 措施 , 需 
要 在 具有 一 定 医疗 水 平 .医疗 条 件 的 医院 才能 被 采用 , 如 医生 的 技术 水 平 ， 医院 的 管理 机 制 
及 设备 条 件 、 病 人 的 意愿 以 及 经 济 的 承受 能 力 等 。 如 像 冠 心病 的 介入 治疗 、 风湿 性 心 疾 膜 病 
的 换 辩 治疗 术 等 , 即使 这 类 治疗 证 明 对 病人 有 利 并 具 颇 佳 效果 , 但 不 具备 上 述 条 件 , 也 是 不 可 
行 的 。 

3. 从 该 治疗 性 证 据 中 , 估计 患者 的 利 、 弊 “采用 某 一 可 行 性 好 的 最 佳 治疗 措施 一 定 是 要 保 
证 利 大 于 弊 , 目 要 有 量化 指标 为 依据 。 最 直接 的 是 用 NNT( 益 处 ) 及 NNH( 害 处 ) 进 行 评价 。 如 
果 这 两 种 指标 不 全 , 则 有 两 种 办 法 帮助 解决 。 

一 是 确定 患者 预期 事件 发 生 率 ( patient’s expected event rate， PEER), 意思 是 如 果 患 者 不 予 
治疗 , 其 最 终结 局 事件 的 发 生 率 。 这 可 以 用 治疗 试验 中 的 安慰 剂 对 照 组 的 事件 发 生 率 ( CER) 
表示 ; 如 无 CER 证 据 , 也 可 根据 临床 积累 的 未 治 或 缺乏 特效 治疗 观察 结果 值 作为 PEER 参考 
值 , 如 像 急 性 心肌 梗死 患者 PEER 约 15%; 另外 也 可 以 亚 组 资料 分 层 分 析 之 相应 的 CER 作为 
PEER 等 。 

当 获 得 PEER 、RRR 及 RRI 等 指标 值 后 ,用 下 列 公式 则 可 推算 : 





1 
a 式 (10-11) 
MA PEER x RRR 


1 和 
NNH= 一 一 一 一 —— 式 (10-12) 
-A PEER x RRI 


二 是 应 用 列 线 图 , 用 已 知 的 PEER( 或 称 不 治疗 的 绝对 危险 率 ) 与 RRR 数据 ,依据 此 两 值 直 
线 连 线 的 延伸 , 与 NNT 线 上 交叉 点 , 即 为 该 NNT。( 图 10-1) 十 分 方便 。 

4. 考虑 患者 对 于 治疗 措施 的 价值 取向 与 期 望 ， 在 循 证 医学 治疗 实践 中 , 一 定 要 尊重 患者 
对 治疗 的 价值 取向 , 即 愿意 接受 或 者 不 愿意 接受 , 或 愿意 接受 哪 一 种 备 选 方案 ( 药物 或 有 关 治疗 
措施 ), 而 且 要 了 解 患者 对 治疗 结局 的 有 关 期 望 。 
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未 涌 疗 时 的 绝对 危险 ”相对 危险 减少 。 需 治疗 人 数 
图 10-1 估计 NNT 的 列 线 图 


首先 , 要 保证 不 良 反 应 最 小 化 ; 同时 还 要 注重 疗效 。 因 此 , 估计 与 掌握 治疗 的 利弊 比 就 十 分 
重要 了 。 通常 应 用 治疗 措施 (或 药物 ) 的 NNT 与 NNH 计算 其 利 次 比 (likelihood of being helped vs 


harmed , LHH ), 
(Ga) 好 
LHH = re 式 (10-13) 
INH 


例如 : 有 关 他 汀 药物 治疗 预防 脑 座 中 的 NNT 为 72, NNH 为 5000, 则 
站 网 
ns 】 = 70, 这 意味 着 有 利 面 是 不 利 面 的 70 售 ， 是 为 安全 和 有 效 的 治疗 证 据 ， 
S000 
显然 LHH 是 越 高 越 佳 。 
如 果 有 几 种 备 选 药物 同时 存在 , 且 它 们 的 疗效 与 不 良 反应 相似 或 有 差异 , 但 没有 显著 意义 。 
对 这 些 备 选 治疗 措施 (或 药物 ), 则 应 优先 选择 其 成 本 (价格 ) 低 廉 且 疗效 也 好 和 安全 的 药物 , 在 
保证 安全 有 效 的 基础 上 , 尽 可 能 地 降低 医疗 成 本 。 同 时 , 对 于 任何 治疗 措施 , 一 定 要 给 患者 尽 
可 能 的 清楚 解释 , 以 保持 良好 的 依从 性 。 并 在 治疗 过 程 中 务必 要 认真 观察 治疗 反应 , 关心 与 爱 
护 患 者 , 这 有 利于 增进 互信 和 和睦 关系 , 避免 产生 不 必要 的 误解 或 纠纷 。 
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二 、 系 统 评价 或 meta 分 析 证 据 评价 


系统 评价 (综述 ) 是 由 多 个 原始 研究 结果 综合 而 成 , 故 许多 内 容 ( 尤 其 是 评价 重要 性 与 适用 
性 的 部 分 ) 与 原始 研究 评价 是 相同 的 , 但 也 存在 不 同 之 处 。 

(一 ) 真实 性 评价 

评价 系统 综述 的 真实 性 , 主要 从 以 下 四 个 方面 进行 : 

1. 是 否 是 随机 试验 的 系统 综述 ”首先 应 该 确定 该 系统 综述 是 针对 随机 试验 还 是 非 随机 化 
试验 。 如 果 是 前 者 , 必须 明确 所 查找 的 每 篇 文献 是 否 真 的 是 随机 试验 , 其 中 是 耕 包 含 了 非 随机 
试验 ; 对 每 篇 合格 文献 质量 是 否 都 作 了 严格 评价 ; 汇总 分 析 是 否 考虑 纳入 研究 结果 间 的 异 质 性 。 

2. 是 否 对 文献 的 检索 过 程 有 详尽 的 描述 ”评价 时 应 仔细 阅读 总 结 报告 中 与 检索 有 关 的 方 
法 学 部 分 , 特别 是 检索 策略 制定 的 合理 性 , 达到 既 完 整 又 准确 。 包 括 检索 范围 是 否 广泛 , 主要 
的 医学 文献 数据 库 是 否 均 被 包括 ,关键 词 运用 是 否 合理 ; 除了 计算 机 检索 外 , 是 否 采用 包括 手 
工 检索 期 刊 、 会 议 记录 、 各 种 论文 、 制 药 公 司 的 数据 库 以 及 联系 已 发 表 文 章 的 相关 作者 等 多 种 
手段 ; 是 否 只 局 限于 单一 语种 等 。 对 以 上 内 容 应 该 进行 较为 详尽 的 描述 。 

3. 是 否 已 对 每 个 纳入 研究 的 质量 进行 严格 评价 ”在 系统 综述 的 方法 学 部 分 还 应 当 说 明 调 
查 者 是 如 何 评价 每 一 篇 入选 文献 的 真实 性 的 , 明确 选用 的 评价 标准 , 文献 纳入 的 方法 , 即 是 否 
由 两 人 或 多 人 独立 进行 评价 。 有 很 好 的 一 致 性 时 , 才 说 明 系 统 综述 结果 更 加 可 信 。 

4. 分 析 时 采用 原始 病人 数据 (IPD ) 还 是 集合 数据 “在 进行 分 析 时 采用 的 数据 是 来 自 原始 
的 病人 资料 还 是 表格 资料 或 是 已 发 表 的 报告 ? 若 利用 的 是 原始 数据 , 则 综述 结论 更 可 信 。 使 用 
原始 资料 还 可 对 病人 发 生 某 一 临床 事件 的 时 间 进 行 更 可 靠 的 分 析 。 

(二 ) 重要 性 评价 

重要 性 评价 主要 考虑 : 

1. 不 同 原始 研究 的 结果 是 否 一 致 如 果 每 一 个 试验 结果 都 显示 了 相似 的 效果 或 者 至 少 方 
向 相同 , 即 有 较 好 的 同 质 性 , 那么 该 系统 综述 的 结果 令 人 信服 。 但 在 实际 研究 中 , 达到 完全 的 
同 质 是 不 可 能 的 , 表现 为 部 分 研究 的 结论 可 能 有 效 , 部 分 为 无 效 , 甚至 有 害 。 此 种 情况 下 更 需 
进一步 分 析 , 找 出 异 质 性 的 来 源 。 

2. 治疗 效果 有 多 大 ”有 较 多 指标 可 以 用 于 系统 综述 的 效果 量 表 达 , 如 NNT、 RRR、ARR、RRI、 
ARI、NNH 等 。 目 前 已 有 许多 系统 综述 用 NNT 来 表示 结果 , 因为 RRR 未 考虑 CER 和 PEER, OR 
和 RR 也 因 同 一 原因 在 临床 实践 中 应 用 较 少 。 现 已 有 一 些 工具 将 RR、OR 转换 为 NNT, 部 分 转 
换 结果 可 参见 表 10-2 及 表 10-3。 




















| 





表 10-2 OR-NNT 转 换 表 ( OR<1) 


OE i 











病人 预期 事件 发 生 率 OR 值 

(PEER) 0.9 0.8 0.7 0.6 0.5 0.4 0.3 
0.05 209™ 104 69 52 41 34 29™) 
0.10 110 54 36 好 21 18 te) 
0.20 61 30 20 14 11 10 8 
0.30 46 14 10 8 7 2 
0.40 40 19 12 9 7 6 4 
0.50 38 18 业 8 6 5 4 
0.70 44 20 13 9 6 5 4 
0.90 101®) 46 27 18 12 9 4 





注 :(a) 此 处 相对 风险 减少 (RRR) 为 10%;(b) 此 处 RRR 为 49%;(c) 此 处 RRR 为 1%;(d) 此 处 RRR 为 9%。 引 自 Jahn 


Geddes.personal communication, 1999 
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表 10-3 OR-NNT 转 换 表 ( OR>1) 











病人 预期 事件 发 生 率 OR 值 
(PEER) 1.1 1.25 1.5 1 人 75 2 2.25 2.5 
0.05 212 86 44 30 23 18 16 
0.10 113 46 24 16 13 10 9 
0.20 64 27 14 10 8 7 6 
0.30 50 21 11 8 6 5 
0.40 44 19 10 8 6 5 E; 
0.50 42 18 10 8 6 6 S 
0.70 51 23 13 10 9 8 7 
0.90 121 55 33 25 2 19 18 


注 : 表 中 数字 是 在 特定 PEER 水 平时 , OR 值 对 应 的 NNT。 此 表 适 用 于 治疗 引起 的 效应 与 副作用 , 引 自 John Geddes. 


personal communication, 1999 


3. 证 据 效果 的 精确 性 如 何 与 对 单项 研究 证 据 结 果 评 价 一 样 , 仍 需要 采用 95% 可 信 区 间 
来 评价 系统 综述 效果 的 精确 性 , 以 进一步 估计 效果 的 强度 及 其 临床 意义 大 小 。 

(三 ) 适用 性 评价 

由 于 系统 综述 中 的 各 个 研究 可 能 来 自 不 同 的 人 群 , 其 合并 效应 估计 值 是 平均 的 疗效 。 因 
此 ,即使 系统 综述 结果 已 经 具备 了 真实 性 、 重 要 性 ,但 也 不 一 定 适用 于 具体 的 病人 , 仍 需要 进行 
适用 性 评价 。 

系统 综述 适用 性 评价 原则 与 评价 单项 研究 相同 。 即 考虑 : 自己 诊治 的 病人 与 研究 中 的 病人 
是 否 存 在 很 大 的 差别 ? 治疗 是 否 适 于 现实 的 情况 ? 治疗 对 病人 的 潜在 利益 和 损害 有 哪些 ? 中 
者 对 治疗 结局 和 提供 的 治疗 方案 的 态度 和 期 望 如 何 ? 但 与 单项 研究 评价 不 同 的 是 , 系统 综述 会 
清楚 地 给 出 不 同 病 人 或 不 同情 况 下 各 亚 组 的 信息 结果 , 从 而 会 更 方便 地 应 用 于 自己 的 病人 。 但 
在 应 用 时 必须 满足 亚 组 病人 的 应 用 条 件 。 

不 是 所 有 的 系统 综述 都 是 高 质量 的 。 在 应 用 系统 综述 作为 证 据 时 ,也 应 该 采取 严格 评价 的 
态度 , 切 不 可 育 信 。 因 为 最 佳 的 系统 综述 必须 基于 高 质量 的 RCTs, 车 RCT 质量 差 、 研 制 者 专业 
水 平 不 高 、 制 作 过 程 中 偏 倚 多 , 其 证 据 价值 一 定 不 高 。 





第 五 节 ” 循 证 实践 及 案例 分 析 





急性 脑 梗 死 (acute cerebral infarction) 是 各 种 诱发 因素 引起 脑 内 动脉 狭窄 、 闭 塞 , 而 造成 局 
部 急性 脑 血液 循环 障碍 , 引起 缺 血 、 缺 氧 导 致 局 灶 性 脑 组 织 的 缺 血性 坏死 、 软 化 。 有 研究 表明 ， 
40 岁 以 后 , 年龄 每 增长 5 岁 , 缺 血 性 脑 卒中 发 病 率 约 增加 一 倍 。 急 性 脑 梗死 是 神经 系统 的 常见 
病 , 致死 率 及 致 残 率 均 较 高 , 对 人 类 及 社会 危害 巨大 。 目 前 , 对 于 该 病 的 主要 治疗 方法 包括 : 溶 
栓 、 抗 血小板 、 抗 凝 、 脑 保护 剂 、 降 纤 治 疗 及 手术 治疗 等 。 选 择 性 血管 内 溶 栓 是 治疗 急性 脑 梗死 
首选 方法 之 一 ,被 认为 能 有 效 缓解 局 部 脑 组 织 缺 血 缺 氧 的 情况 , 减少 脑 组 织 的 梗死 面积 。 但 救 
治 时 间 窗 、 患 者 基础 情况 不 同 会 导致 最 佳 的 治疗 措施 不 同 , 故 针对 临床 上 菜 一 具体 的 急性 脑 梗 
死 患 者 , 医生 常会 遇 到 , 如 该 患者 最 佳 治疗 措施 是 什么 , 患者 是 否 应 该 使 用 溶 栓 治疗 , 应 该 选用 
哪 种 溶 栓 药 , 急性 脑 梗死 患者 如 何 处 理 血压 等 一 系列 问题 。 本 节 将 以 此 实例 进行 循 证 实践 。 


一 .疾病 案例 


患者 女性 , 65 岁 , 右 侧 半 身 无 力 , 说 话 不 清 ,4 小 时 收入 某 院 神经 内 科 , 有 高 血压 病史 15 年 。 
查 体 : 神 清 , 体温 36.5% , 脉搏 80 次/ 分钟, 血压 165/95mmHeg, 发 育 正常 , 营养 良好 , 头颅 无 畸 
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形 , 心肺 腹部 无 异常 , 双 瞳 孔 等 大 等 圆 , 光 反 射 正常 ,眼底 阴性 , 脑 神经 阴性 , 有 鼻 展 沟 变 浅 。 检 
测 : 急诊 脑 部 CT 扫描 没有 出 血 和 其 他 异常 密度 影 ; 血 生化 及 常规 检查 正常 ; 全 脑 血管 造影 检查 
发 现 右 侧 大 脑 半 球 血 流量 明显 减少 。 初 步 诊断 为 急性 脑 梗死 。 


二 、 提 出 问题 


针对 上 述 这 位 伴 有 高 血压 的 急性 脑 梗死 患者 提出 临床 问题 : 能 否 使 用 溶 栓 药物 治疗 ?是 否 
应 该 降 血 压 ? 其 他 疗法 应 该 怎样 选择 ? 


三 .检索 证 据 


全 面 收集 有 关 研 究 证 据 一 一 查寻 最 新 指南 \、 系 统 综述 .临床 研究 证 据 。 英 文 以 acute ischemia 
stroke、thrombolysis、hypertension 为 关键 词组 合 分 别 检 索 PubMed、 Web of Science、Cochrane Library 
等 英文 数据 库 ; 中 文 以 中 国学 术 期 刊 网 (CNKI) 全 文 数据 库 、 重 庆 维 普 (VIP) 中 文科 技 期 刊 全 文 
数据 库 、 万 方 科技 期 刊 全 文 数据 库 作为 检索 数据 库 , 以 急性 脑 梗 死 、 急 性 脑 缺 血 、 溶 栓 及 高 血 
压 作 为 关键 词 进行 检索 。 制定 检索 策略 时 , 注意 检索 词 的 变换 使 用 , 如 acute cerebral infarction、 
acute cerebral ischemia 、 thrombolysis therapy\ blood pressure 等 。 检索 结 果 : 关于 溶 栓 治疗 急性 脑 
梗死 的 国内 外 研究 相对 较 多 , 其 中 检索 到 3 篇 最 新 相关 指南 、 近 百 篇 系统 评价 及 meta 分 析 , 包 
括 8 篇 在 Cochrane 图 书馆 注册 的 相关 系统 评价 。 其 中 , 2003 年 发 布 的 美国 和 欧洲 指南 各 一 个 ， 
并 分 别 于 2006 年 和 2008 年 更 新 ; 2007 年 发 布 的 中 国 脑 血管 病 防 治 指南 , 并 于 2010 年 第 一 次 
修正 。 





四 .评价 证 据 

严格 评价 研究 证 据 。 根 据 具 体 的 临床 问题 , 寻找 答案 。 指 南 及 系统 评价 是 在 综合 相应 证 据 
的 基础 上 , 具有 较 高 的 证 据 级 别 , 其 次 是 高 质量 的 随机 对 照 试验 。 针 对 本 例 中 提出 的 问题 , 检 
索 到 了 多 个 指南 , 对 其 给 出 的 推荐 予以 重点 考虑 。 

(一 ) 能 否 采用 溶 栓 治疗 

有 关 指 南 和 证 据 结论 如 下 : 

1. 指南 均 建议 对 缺 血性 脑 座 中 发 病 3 小 时 内 ( I 级 推荐 , A 级 证 据 ) 和 3~4.5 小 时 ( 工 级 推 
荐 ,B 级 证 据 ) 的 患者 , 应 根据 适应 证 严格 筛选 患者 , 尽快 静脉 给 予 重组 组 织 型 纤 溶 酶 原 激活 (nt- 
PA ) 溶 栓 治疗 。 

2. 在 发 病 初 期 , 尚 无 其 他 溶 栓 药物 可 以 代替 rt-PA 的 研究 证 据 。 

3. 其 他 溶 栓 药物 只 能 在 临床 试验 的 情况 下 使 用 。 

溶 栓 治 疗 的 研究 证 据 : Wardlaw 2009 年 的 Cochrane 系统 评价 收集 了 全 世界 26 个 RCT( 包 括 
7152 例 病人 ), 结果 为 : 溶 栓 治疗 组 致死 性 版 内 出 血 较 未 溶 栓 组 增加 5 倍 , 症状 性 颅 内 出 血 增加 
3.5 倍 , 远 期 病死 率 约 增高 13。 但 3~6 个 月 后 6 小 时 内 使 用 溶 栓 治疗 者 , 死亡 或 残疾 的 危险 降 
低 19%, 3 小 时 内 溶 栓 者 似乎 更 为 有 效 。 结 论 是 : 溶 栓 组 早期 死亡 和 颅 内 出 血 的 风险 增加 , 但 
这 些 风 险 可 被 存活 者 残疾 率 降低 的 效果 所 抵消 。@ 不 清楚 哪些 病人 可 能 受益 , 哪些 病人 可 能 风 
险 更 大 。@@ 开 始 治疗 的 时 间 可 能 和 预后 有 关 。@ rt-PA 研究 提示 3 小 时 内 使 用 效果 较 好 , 6 小 时 
内 使 用 仅 限于 条 件 较 好 的 机 构 , 并 上 且 需 非常 谨慎 的 选择 病例 , 大 范围 常规 使 用 尚 无 充分 证 据 。 

(二 ) 血压 的 处 理 问 题 

美国 指南 建议 : 对 急性 缺 血性 脑 卒 中 ( 脑 梗死 ) 患 者 的 高 血压 处 理应 十 分 灌 慎 , 首先 应 密 
切 监测 血压 , 处 理 焦虑 、 头 痛 、 处 理 高 颅 内 压 。@@ 经 上 述 处 理 后 血压 仍 持续 升 高 > 220/120mmHg 
时 可 用 降 压 药 , 但 须 慎 重 进行 , 缓慢 降 压 。 图 紧急 情况 下 应 使 用 非 肠 道 给 药 。 避 免 使 用 强 作用 
的 长 效 降 奈 药物。 多 对 有 溶 栓 指 征 的 患者 , 血压 应 降 至 <185/110mmHg。 欧 洲 指南 建议 : DD 脑 醒 
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死 血 压 > 200/120~220/120mmHg, 脑 出 血 患 者 血压 持续 >180/105mmHg 时 可 用 降 压 药 。@ 有 溶 
栓 指 征 的 患者 , 收缩 压 应 降 至 185mmHsg 以 下 。@ 对 有 心 衰 、 急 性 心肌 梗死 、 和 急性 肾 衰 使 用 溶 栓 
或 抗 凝 情况 的 患者 , 应 立即 降 压 。 国 内 指南 建议 : 准备 溶 栓 者 , 应 使 收缩 压 <180mmHg、 和 舒张 
压 <100mmHg。@ 缺 血性 脑 痊 中 后 24 小 时 内 血压 升 高 的 患者 应 谨慎 处 理 。 应 先 处 理 紧 张 焦虑 、 
疼痛 、 恶 心 呕吐 及 颅 内 压 增高 等 情况 。 血 压 持 续 升 高 , 收缩 压 >200mmHsg 或 舒张 压 >110mmHg， 
或 伴 有 严重 心 功能 不 全 、 主 动脉 夹层 、 高 血压 脑病 , 可 予 谨慎 降 压 治疗 , 并 严密 观察 血压 变化 ， 
必要 时 可 静脉 使 用 短 效 药物 (如 拉 贝 洛 尔 、 尼 卡 地 平 等 ), 最 好 应 用 微量 输液 泵 , 避免 血压 降 得 
过 低 。@ 有 高 血压 病史 且 正 在 服用 降 压 药 者 , 如 病情 平稳 , 可 于 脑 座 中 24 小 时 后 开始 恢复 使 用 
降 压 药物 。@ 脑 座 中 后 低 血压 的 患者 应 积极 寻找 和 处 理 原因 , 必要 时 可 采用 扩容 升 压 措施 。 

(三 ) 关于 其 他 疗法 

欧美 的 指南 建议 : @ 证 据 充 分 应 广泛 使 用 : 卒中 单元 , 阿司匹林 100~300mg/d( 【类 证 据 , A 
级 建议 )。@ 证 据 欠 充分 应 限制 使 用 : 有 高 度 深 静 脉 血栓 形成 或 肺 栓塞 风险 的 患者 , 建议 应 当 
考虑 给 予 低 剂 量 皮下 肝素 或 低 分 子 量 肝 素 ( I 类 证 据 , A 级 建议 )。@ 目 前 不 推荐 : 无 选择 使 用 
抗 凝 剂 、 血 液 稀 释 疗法 、 多 种 神经 保护 剂 等 。 国 内 指南 给 出 了 较 细致 的 建议 , 例如 : @ 对 于 不 符 
合 溶 栓 适 应 证 且 无 禁忌 证 的 缺 血 性 脑 卒中 患者 应 在 发 病 后 尽早 给 予 口服 阿司匹林 150~300mg/d 
(了 I 级 推荐 , A 级 证 据 )。@ 对 大 多 数 急 性 缺 血 性 脑 卒中 患者 , 不 推荐 无 选择 地 早期 进行 抗 凝 治疗 
( 工 级 推荐 ,A 级 证 据 )。 

所 查 到 的 指南 和 系统 评价 报告 已 对 证 据 进行 了 质量 评价 , 故 可 以 直接 进入 到 下 一 步 。 在 没 
有 相应 指南 及 系统 综述 的 情况 下 , 应 对 纳入 的 各 研究 进行 仔细 评价 , 其 中 随机 对 照 试 验 是 一 种 
前 瞻 性 研究 , 在 各 种 临床 疗效 研究 中 的 论证 强度 最 高 , 所 以 对 大 型 随机 对 照 试验 也 应 给 予 一 定 
的 重视 , 明确 各 研究 纳入 的 患者 特征 、 各 组 干预 措施 的 选择 , 从 组 间 基 线 可 比 性 、 随 访 时 间 、 随 
机 化 分 组 、 盲 法 、 失 访 率 等 方面 评价 各 研究 。 

五 .实践 决策 

经 过 研究 结果 的 整理 和 分 析 , 应 用 于 具体 病人 的 处 理 上 。 针 对 该 病例 , 可 以 参考 上 述 指南 的 
推荐 意见 。 故 医生 可 以 参照 指南 , 根据 当地 的 习惯 和 经 验 进行 处 理 : @O 可 以 考虑 静脉 使 用 rt-PA。 
@ 若 医生 及 病人 均 不 愿 冒 早期 颅 内 出 血 增加 的 危险 以 获得 远 期 残疾 率 降 低 的 效益 , 也 可 不 用 溶 
栓 治疗 而 立即 使 用 阿司匹林 、 对 症 、 支 持 和 防止 并 发 症 及 复发 等 措施 ,有 条 件 则 进入 卒中 单元 。 
@ 病 人 的 血压 不 是 太 高 , 故 暂 时 不 需 使 用 降 压 药 。 医 生 将 这 些 意见 告知 病人 及 家 属 , 考虑 到 价 
格 昂贵 和 担心 出 血 的 风险 ,病人 方面 选择 放弃 溶 栓 治疗 , 而 选择 了 证 据 确凿 的 其 他 疗法 。 

















六 .小 结 


急性 脑 梗死 一 种 严重 损害 人 类 健康 的 常见 病 , 脑 血 栓 与 脑 栓塞 所 致 的 脑 梗死 占 急 性 脑 血管 
病 的 70%, 因此 脑 缺 血性 梗死 的 治疗 越 来 越 为 人 们 所 重视 。 本 节 具体 应 用 循 证 实践 的 5 个 步骤 ， 
对 急性 脑 梗死 患者 开展 循 证 治疗 。 第 一 步 , 提出 需 解 决 的 实际 问题 。 第 二 步 , 检索 相关 证 据 ， 
重点 在 于 设计 恰当 检索 策略 , 通过 国内 外 各 大 权威 数据 库 , 全 面 检索 出 可 信 度 高 的 证 据 。 第 三 
步 , 评价 证 据 , 根据 适当 的 标准 , 对 研究 的 质量 特征 进行 严格 评价 , 明确 高 质量 研究 。 第 四 步 ， 
制定 决策 , 根据 当前 最 好 的 证 据 , 结合 患者 的 实际 情况 及 意愿 ,给 予 患者 最 好 的 临床 治疗 。 第 
五 步 , 后 效 估计 , 即 治疗 决策 应 用 后 患者 对 治疗 的 反应 。 治 疗 指南 及 相关 的 系统 综述 无 疑 是 疗 
效 评价 的 最 佳 证 据 , 但 缺乏 相应 的 证 据 时 , 临床 医生 就 应 对 现 有 的 随机 对 照 试验 等 研究 进行 评 
价 ,结合 患者 的 实际 情况 及 治疗 措施 的 利 整 进行 综合 考虑 , 做 出 决策 。 
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本 章节 介绍 了 预后 的 基本 概念 、 预 后 研究 设计 方案 、 基 本 步 又、 主要 统计 分 析 方法 、 常 见 偏 
倚 及 其 处 理 以 及 预后 研究 的 基本 评价 原则 和 标准 。 预 后 是 指 疾病 发 生 后 ,对 将 来 发 展 为 各 种 不 
同 后 果 的 预测 或 事前 估计 。 预 后 研究 包括 研究 疾病 各 种 结局 发 生 的 概率 以 及 影响 预后 的 预后 
因素 研究 。 预 后 研究 最 常用 的 研究 设计 方案 是 队列 研究 ,包括 回顾 性 队列 和 前 脆性 队列 研究 。 
预后 研究 常用 的 观察 指标 有 生存 率 、 中 位 生存 时 间 等 ,常用 的 统计 分 析 方法 有 单 因 素 Log-rank 
分 析 和 多 因素 COX 回归 分 析 。 对 有 关 疾 病 预 后 研究 的 质量 及 其 研究 结论 是 否 真实 可 靠 , 其 评 
价 的 原则 和 标准 可 归纳 为 九条 。 





第 一 节 ”疾病 预后 的 概念 


一 、 疾 病 预 后 及 其 研究 的 意义 

预后 ( prognosis ) 是 指 疾病 发 生 后 , 对 将 来 发 展 为 各 种 不 同 后 果 ( 痊 愈 、 复 发 、 恶化、 伤 残 、 并 
发 症 和 死亡 等 ) 的 预测 或 事前 估计 , 通常 以 概率 表示 , 如 治愈 率 、 复 发 率 、5 年 生存 率 等 。 预 后 研 
究 就 是 关于 疾病 各 种 结局 发 生 的 概率 及 其 影响 因素 的 研究 。 医 生 、 患 者 及 其 家 属 都 迫切 需要 了 
解 该 病 的 预后 情况 , 医生 知道 该 病 预 后 情况 , 不 仅 对 选择 治疗 方案 有 重要 意义 , 而且 可 以 回答 
患者 及 其 家 属 所 提出 的 各 种 问题 。 然 而 , 要 对 预后 做 出 客观 估计 与 判断 , 尽 可 能 使 预后 的 结果 
接近 患者 的 实际 结局 , 有 时 有 一 定 难 度 , 只 有 进行 疾病 预后 研究 , 在 掌握 了 大 量 的 预后 信息 后 
才能 做 到 科学 的 预测 。 

疾病 预后 研究 的 意义 在 于 : 了 解 某 种 疾病 的 发 展 趋 势 和 后 果 , 从 而 帮助 临床 医师 做 出 治疗 
决策 ; 研究 影响 疾病 预后 的 各 种 因素 , 有 助 于 干预 并 改善 疾病 的 预后 。 此 外 , 可 以 从 疾病 预后 
研究 中 , 来 正确 评定 某 项 治疗 措施 的 效果 , 从 而 促进 治疗 水 平 的 提高 。 例 如 治疗 癌症 方案 A 的 
5 年 生存 率 高 于 方案 B, 则 说 明 方 案 A 的 疗效 较 好 , 应 该 选择 方案 A。 因 此 , 疾病 预后 的 研究 具 
有 重要 的 临床 意义 。 




















二 、 疾 病 的 自然 病史 

疾病 的 自然 病史 ( natural history ) 是 指 在 不 给 任何 治疗 或 干预 措施 的 情况 下 , 疾病 从 发 生 、 
发 展 到 结局 的 整个 过 程 。 疾 病 的 自然 病史 包括 四 个 时 期 : 

1. 生物 学 发 病 期 (biologic onset) 指 病原 体 或 致 病因 素 作 用 于 人 体 引 起 有 关 脏 器 的 生物 学 
反应 ,以 及 复杂 的 病理 生理 学 改变 , 但 此 时 很 难 用 一 般 临床 检查 手段 发 现 疾病 已 经 发 生 。 

2. 亚 临 床 期 (subclinical stage ) 是 指 病变 的 脏 器 损害 加 重 , 出 现 了 临床 前 期 的 改变 , 患者 
昌 无 明显 症状 , 自觉 “健康 ”, 但 车 采用 某 些 实验 室 检查 或 特异 性 高 及 灵敏 度 高 的 诊断 手段 , 可 
以 做 到 早期 发 现 、 早 期 诊断 和 早期 治疗 。 

3. 临床 期 (clinical stage) 指 患 者 病变 脏 器 更 加 严重 而 出 现 解剖 上 的 改变 和 功能 障碍 , 临 
床 症状 、 体 征 和 实验 室 检查 出 现 异常 , 因 患者 主动 就 医 而 被 诊治 。 

4. 结局 (outcome ) 指 疾病 经 历 了 上 述 过 程 ,发展 到 终 末 的 结局 , 如 疼 愈 、 伤 残 或 死亡 等 。 

不 同 疾病 , 其 自然 病史 差别 很 大 , 某 些 疾病 自然 病史 较 短 , 如 急性 感染 性 疾病 , 短期 内 出 现 
症状 体征 和 实验 室 异 常 , 进展 较 快 , 较 短 时 期 内 即 可 出 现 结局 。 而 某 些 慢性 非 传 染 性 疾病 的 自 
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然 病 史 较 长 , 甚至 可 达 数 十 年 之 久 , 如 心 脑 血 管 疾病 、 糖 尿 病 、COPD 等 , 这 些 疾病 的 自然 病史 也 
比较 复杂 。 研 究 疾 病 的 自然 病史 对 病因 和 预后 研究 、 早 期 诊断 和 预防 、 判 断 治疗 效果 都 有 重要 
的 意义 。 





三 .临床 病程 
临床 病程 (clinical course ) 是 指 疾病 的 临床 期 , 即 首 次 出 现 症状 和 体征 , 一 直到 最 后 结局 所 
经 历 的 全 过 程 , 其 中 可 经 历 各 种 不 同 医疗 干预 措施 。 临 床 医师 可 采取 医疗 干预 措施 来 改变 其 
病程 。 
病程 的 概念 和 疾病 自然 病史 不 同 ,病程 可 以 因 医 疗 干预 (包括 各 种 治疗 措施 ) 而 发 生 改 变 ， 
进而 改变 预后 。 在 病程 早期 就 采取 积极 医疗 干预 措施 , 往往 预后 较 好 , 在 病程 晚期 进行 医疗 干 
预 措施 的 效果 就 不 那么 明显 , 疾病 预后 就 比较 差 , 因此 , 临床 医师 十 分 重视 临床 病程 的 估计 。 


四 .预后 因素 


岂 影 响 疾病 预后 的 因素 都 可 称 预后 因素 (prognostic factors ), 若 患者 具有 这 些 影 响 因 素 , 其 
疾病 发 展 过 程 中 出 现 某 种 结局 的 概率 就 可 能 由 此 发 生 改变 。 预 后 因素 的 研究 有 助 于 临床 医师 
及 早 进行 医学 干预 ,包括 得 检 、 及 时 诊断 、 积 极 治疗 和 改变 患者 影响 健康 的 不 良 行为 等 , 从 而 改 
善 患者 的 预后 。 预 后 因素 和 危险 因素 不 同 , 危险 因素 (risk factor ) 是 指 作 用 于 健康 人 , 能 增加 患 
病危 险 性 的 因素 , 而 预后 因素 是 在 已 经 患 病 的 病人 中 研究 与 疾病 结局 有 关 的 因素 , 因此 , 疾病 
的 危险 因素 和 预后 因素 是 不 同 的 概念 。 虽 然 有 些 疾病 中 某 些 因素 既是 危险 因素 , 也 是 预后 因 
素 , 但 多 数 是 不 相同 的 , 例如 从 图 11-1 可 见 急 性 心肌 梗死 的 危险 因素 与 预后 因素 , 有些 因素 是 
相同 的 , 且 作 用 相似 , 如 年 龄 和 吸烟 , 随 年 龄 增 大 , 患 病危 险 性 增加 , 预后 也 差 。 但 有 些 因 素 是 
相反 的 , 如 性 别 , 男性 发 生 急 性 心肌 梗死 危险 性 比 女 性 增加 , 但 发 生 心 肌 梗 死 后 女性 的 预后 比 
男性 差 。 又 如 血压 ,高 血压 是 危险 因素 ,发生 急性 心肌 梗死 后 低 血 压 则 预后 不 佳 。 














健康 呈 一 > 急性 心肌 梗死 发 作 呈 一 > 结局 : 死亡， 再 次 梗死 ， 恢 复 


危险 因素 : 预后 不 良 因素 : 
高 龄 高 龄 
男性 女性 
吸烟 吸烟 
高 血压 低 血压 
高 LDL 低 HDL 前 壁 心 梗 
不 爱 运动 充血 性 心力 衰竭 
炎症 室 性 心律 失常 
凝血 功能 异常 


11-1 急性 心肌 梗死 的 危险 因素 和 预后 因素 之 间 的 差别 


影响 疾病 预后 的 因素 是 复杂 多 样 的 , 概括 起 来 有 以 下 几 个 方面 : 

(一 ) 早期 诊断 、 及 时 治疗 

任何 疾病 能 否 得 到 早期 正确 诊断 , 及 时 合理 治疗 , 是 影响 预后 的 重要 因素 。 尤 其 是 恶性 实 
体 瘤 , 如 能 早期 及 时 诊断 , 通过 手术 治疗 , 常 能 获得 较 好 的 预后 。 而 发 现 较 晚 ,已 多 处 转移 , 失 
去 手术 根治 机 会 , 则 预后 很 差 。 如 胃癌 , 通过 胃镜 发 现 的 早期 角 癌 , 如 微小 胃癌 术 后 5 年 生存 率 
可 达 100%, 原 位 癌 术 后 10 年 生存 率 也 可 达到 80%, 如 侵 及 黏膜 下 者 , 10 年 生存 率 65%, 如 侵 及 
回 有 肌 层 者 术 后 5 年 生存 率 70%; 而 中 晚期 胃癌 术 后 5 年 生存 率 仅 为 16.9%。 
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(二 ) 疾病 本 身 的 特点 


实 席 本 各 的 特点 包括 疾病 的 性 质 ,病程 . 临 床 关 型 与 病变 程度 等 党 是 影响 疾病 预后 的 重要 
因素 。 茶 些 自 限 性 疾病 如 上 呼吸 道 病毒 感染 , 不 需要 治疗 也 可 自 愈 ,预后 良好 ， 同样 是 病毒 感 
妆 如 交 滋 病 和 重症 肝炎 ,预后 就 很 差 , 败血症 虽然 病情 很 重 ,但 可 采用 有 效 抗生素 治疗 而 症 人 ， 
但 运动 神经 无 疾 病 肌 姜 缩 侧 束 硬化 虽 发 展 级 慢 , 但 无 有 效 治疗 , 预后 很 差 , 最终 都 因 呼 吸 麻 闻 
开发 肺 深 感 染 死 亡 ; 逢 厅 金 病 的 预后 和 病理 类 型 有 关 , 结 节 硬化 型 预后 最 好 , 5 年 生存 率 90% 以 
ss 而 淋巴 细胞 削减 型 预后 最 差 ， 5 年 生存 率 仅 约 30%。 

(三 ) 患者 的 病情 

通常 病情 预后 密切 相关 ,病情 重 者 ,预后 较 差 。 例 如 , 黄 疮 腹水 型 重 症 传染 性 肝炎 的 预 
后 远 比 无 腹水 的 、 轻 或 中 型 肝炎 的 预后 为 差 。 

(四 ) 患者 的 身体 素质 

沁 者 的 身体 素质 是 一 项 综合 指标 ,包括 年 龄 .性别 、 营 养 状况、 免疫 功能 等 。 同 一 种 疾病 ， 
让 了 了 感 者 身体 素质 不 同 ,预后 差别 可 以 很 大 。 例 如 同一 病理 类 型 的 非 尖 奇 金 淋 巴 净 , 如 患者 身 
体 素质 较 差 ,年 龄 大 ,营养 状况 差 ,不 能 耐 受 强化 疗 , 因而 ,病情 易 加 重 , 生存 期 短 ,预后 差 。 而 
身体 素质 好 的 患者 , 经 过 正规 强化 疗 ,不仅 可 长 期 生存 , 甚至 可 以 治愈 。 

(五 ) 医疗 条 件 
医疗 条 件 的 优 劣 ,也 会 影响 疾病 预后 。 例 如 败血症 可 因 抗生素 选择 不 合理 ,疗效 差 ; 如 果 
细菌 培养 、 药 物 敏感 试验 合理 选用 抗生素 , 疗效 可 以 提高 ,预后 较 好 。 又 如 急性 心肌 梗死 
在 生 疗 条 件 差 的 医院 , 许多 有 效 治疗 措施 都 不 能 实施 ,病死 率 较 高 ; 而 条 件 好 的 医院 不 仅 医疗 
设施 好 ,患者 早期 的 正确 诊断 率 高 且 有 抢救 经 验 丰富 的 专科 医师 及 许多 有 效 治疗 措施 如 深 检 治 
疗 、 径 皮 冠 状 动脉 星 内 成 形 术 、 冠 状 动脉 支架 术 、 冠 状 动脉 措 桥 手术 等 都 可 以 选择 , 从 而 可 以 降 
低 病死 率 , 改善 预后 。 

(六 ) 社会 、 经 济 和 家 庭 因 素 

如 医疗 制度 、 社 会 保险 制度 、 家 庭 成 员 之 间 关 系 、 家 庭 经 济 状况 、 文 化 教养 .患者 宗教 信仰 
及 心理 因素 等 也 会 影响 患者 疾病 的 预后 。 











结合 
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一 、 各 种 率 的 指标 

(一 ) 病死 率 (case-fatality rate) 

在 患 某 病 患者 总 人 数 中 , 死 于 该 病 的 患者 所 占 的 比例 。 常 用 于 病程 短 且 容 易 死亡 的 疾病 ， 
如 各 种 传染 病 、 急 性 中 毒 、 心 脑 血管 疾病 的 急性 期 和 迅速 致死 的 癌症 。 

病死 率 =( 因 该 病死 亡 人 数 / 患 该 病 接 受 治疗 的 总 患者 人 数 )x 100% 

(二 ) 疾病 死亡 率 (disease-specific mortality) 

一 定 的 时 期 内 (通常 指 一 年 ), 某 一 人 群 中 因为 某 病死 亡 的 人 数 所 占 的 比例 , 一般 以 /10 万 
或 1/ 万 为 单位 。 

(三 ) 治 盒 率 (cure rate) 

系 指 患 病 治愈 的 患者 人 数 占 该 病 接受 治疗 患者 总 数 的 比例 。 

治愈 率 =( 患 某 病 治愈 的 患者 人 数 / 患 该 病 接受 治疗 的 总 患者 人 数 ) x 100% 

(四 ) 缓解 率 (remission rate) 

进行 某 种 治疗 后 , 进入 疾病 临床 消失 期 的 病例 数 占 总 治疗 例 数 的 百分比 。 有 完全 缓解 率 、 
部 分 缓解 率 和 自发 缓解 率 之 分 。 
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缓解 率 =( 治疗 后 进入 疾病 临床 消失 期 的 病例 数 / 接受 该 种 治疗 的 总 病例 数 )x100% 
(五 ) 复发 率 (recurrence rate) 
疾病 经 过 治疗 已 有 一 定 程度 缓解 或 痊愈 后 又 重复 发 作 的 患者 数 占 观 察 患者 总 数 的 百分比 。 
复发 率 =( 复 发 的 患者 数 /接受 观察 的 患者 总 数 )x 100% 

(六 ) 总 体 生 存 率 (overall survival rate, OS) 

从 疾病 临床 过 程 的 某 一 点 开始 ,能 存活 一 段 时 间 的 病例 数 占 总 观察 例 数 的 百分比 。 生 存 率 
常用 于 病程 长 .致死 性 疾病 , 如 各 种 癌症 。 病程 较 短 的 可 用 1 年 生存 率 ， 较 长 者 用 5 年 生存 率 表 
示 预 后 。 例 如 急性 髓 系 白 血 病 (AML) 的 5 年 生存 率 为 20%, 表明 从 诊断 AML 开始 随访 有 大 约 
20% 的 患者 可 以 生存 5 年 以 上 。 

预后 研究 仅仅 报道 生存 率 是 不 够 的 ,例如 图 11-2 中 4 种 情况 5 年 生存 率 均 为 10%, 但 5 年 
间 生 存 率 的 变化 趋势 截然 不 同 。 
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11-2 ”四 种 不 同人 和 群 的 生存 曲线 
注 : 5 年 生存 率 均 为 10%, 但 生存 曲线 明显 不 同 , 说 明 仅 报道 5 年 生存 率 有 
很 大 的 局 限 性 , 虚线 为 中 位 生存 时 间 


(七 ) 无 病 生存 率 (disease-free survival rate) 

常用 于 癌症 的 结局 判断 , 指 疾病 经 过 治疗 达到 临床 缓解 后 , 未 出 现 临床 疾病 复发 或 死亡 的 
患者 占 所 有 临床 缓解 患者 的 比例 。 例 如 100 例 AML 患者 经 过 某 一 化 疗 方案 治疗 ,有 70 例 达到 
完全 缓解 , 3 年 内 有 20 例 复发 , 各 种 原因 死亡 5 例 , 则 应 用 该 化 疗 方案 治疗 AML 的 3 年 无 病 生 
存 率 为 45%(45/100)。 

( 八 ) 无 进展 生存 率 (progression-free survival rate, PFS) 

常用 于 癌症 的 结局 判断 , 指 疾 病 经 过 治疗 达到 病情 稳定 后 , 没有 临床 疾病 进展 或 死亡 的 患 
者 占 所 有 临床 稳定 患者 的 比例 。 例 如 100 例 肺癌 患者 经 过 手术 治疗 , 达到 病情 稳定 , 3 年 内 75 
例 病情 无 进展 , 20 例 病情 有 进展 , 各 种 原因 死亡 5 例 , 则 3 年 无 进展 生存 率 为 75%(75/100)。 
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二 .中 位 时 间 

(一 ) 中 位 生存 时 间 (median survival time) 

又 称 为 半数 生存 期 , 即 当 累积 生存 率 为 0.5 时 所 对 应 的 生存 时 间 , 表示 只 有 50% 的 患者 可 
以 活 过 这 个 时 间 。 例 如 AML 的 中 位 生存 期 为 20 个 月 ,说 明 诊断 为 AML 后 只 有 50% 的 患者 可 
以 活 过 20 个 月 。 

利用 生存 曲线 可 以 计算 中 位 生存 时 间 , 图 11-2 中 夹层 主动 脉 瘤 的 中 位 生存 时 间 不 足 半 年 ， 
肺癌 不 足 2 年 , HIV 感染 约 为 3 年 。 

(二 ) 中 位 无 病 生存 时 间 (median disease-free survival time) 

基本 概念 同上 , 如 果 AML 的 中 位 无 病 生 存 时 间 为 18 个 月 ,表明 有 50% 的 患者 可 以 在 无 临 
床 疾病 的 状态 下 存活 18 个 月 。 无 病 生存 时 间 一 般 从 疾病 缓解 之 日 .手术 切除 之 日 开始 算 起 , 到 
疾病 复发 或 死亡 为 止 。 

(三 ) 中 位 无 进展 生存 时 间 (median progression-free survival time) 

指 从 规定 的 随访 起 始点 开始 , 直至 疾病 进展 或 死亡 的 中 位 时 间 。 在 疗效 评价 中 , 常用 随机 
化 之 日 为 起 始点 , 例如 比较 分 子 靶 向 药物 吉 非 替 尼 和 常规 化 疗 作为 一 线 治 疗 肺癌 的 长 期 疗效 ， 
新 诊断 的 肺癌 患者 随机 分 两 组 , 一 组 为 吉 非 替 尼 治疗 组 , 一 组 为 常规 化 疗 组 , 长 期 随访 , 观察 
PFS 和 0S 等 预后 指标 。 随 机 化 之 日 为 观察 起 始点 , 疾病 的 进展 或 各 种 原因 的 死亡 为 观察 终点 。 


三 、 健 康 相关 生存 质量 及 其 衍生 指标 
健康 相关 生存 质量 (health related quality of life, HRQL) 也 是 常用 的 预后 研究 指标 , 常用 量 
表 进 行 评定 , 不 同 的 疾病 有 不 同 的 量 表 , 主要 包括 生理 功能 、 心 理 功能 、 社 会 功能 和 对 健康 状 
况 的 总 体感 受 等 方面 。HRQL 若 进一步 结合 生存 时 间 , 可 以 进行 效用 评价 。 效 用 指标 对 于 临床 
医疗 卫生 决策 以 及 卫生 资源 分 配 等 , 有 重要 的 参考 价值 。 一 般 采 用 质量 调整 寿命 年 (quality- 
adjusted life years, QALYs) 表 示 。QALYs 可 为 不 同 健康 服务 干预 措施 的 结果 评价 与 抉择 提供 重 
要 信息 。 若 结合 成 本 费用 还 可 进一步 实施 卫生 经 济 学 的 成 本 -效用 分 析 。 
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一 、 疾 病 预 后 研究 常用 设计 方案 

疾病 预后 研究 包括 预后 因素 的 研究 及 预后 的 评定 。 基 于 研究 目的 和 可 行 性 , 可 以 选择 描述 
性 研究 、 病 例 对 照 研究 、 回 顾 性 队列 研究 、 前 瞻 性 队列 研究 等 不 同 设计 方案 。 理 论 上 最 佳 的 设 
计 方 案 是 随机 对 照 临床 试验 , 但 其 可 行 性 差 , 所 以 预后 研究 最 常用 的 研究 方案 是 队列 研究 , 包 
括 回顾 性 队列 研究 和 前 瞻 性 队列 研究 , 以 后 者 为 佳 。 研 究 设计 方案 不 同 , 其 研究 结果 可 以 相差 
很 大 。 例 如 , 研究 方法 不 当 造 成 泌尿 系统 结石 的 复发 率 可 由 20% 到 100% 不 等 , 不 同 研究 设计 
的 溃疡 性 结肠 炎 癌 变 率 结果 可 从 3% 至 10%, 相差 数 倍 。 

疾病 预后 的 评定 指标 , 如 病死 率 、 治 愈 率 、 缓 解 率 、 复 发 率 、 致 残 率 、 生 存 率 等 , 可 以 通过 长 
期 随访 研究 对 象 的 纵向 描述 性 研究 获得 。 若 要 比较 两 组 病例 的 预后 , 如 两 组 生存 率 比 较 等 , 可 
以 借助 纵向 的 队列 研究 完成 。 


二 、 疾 病 预 后 研究 设计 中 的 若干 注意 事项 


(一 ) 队列 研究 的 起 始点 
预后 研究 车 采用 队列 研究 设计 , 首先 应 确定 队列 研究 的 起 始点 , 又 称 为 零点 时 间 (zero time)， 
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该 起 始点 在 研究 设计 时 必须 要 明确 规定 , 是 从 病程 的 哪 一 点 开始 观察 , 两 个 队列 中 的 每 一 个 研 
究 对 象 都 要 使 用 同一 起 始点 , 进行 追踪 和 观察 以 及 预后 结局 的 比较 。 对 于 预后 研究 , 要 尽 可 能 
选择 疾病 的 早期 , 若 队 列 的 集合 时 间接 近 疾 病 初 发 时 点 , 则 称 起 始 队列 (inception cohort), 为 队 
列 研 究 的 首选 。 但 在 队列 研究 中 , 病人 往往 处 于 病程 的 不 同 阶段 , 开始 观察 时 间 不 同 , 很 难 确 
定康 复 .复发 .死亡 等 具体 时 间 , 倘若 有 些 病 人 采用 普查 检 出 时 间作 为 零点 时 间 , 有 的 是 按 治疗 
开始 日 算 起 , 零点 时 间 不 统一 , 难以 评价 真正 的 预后 , 甚至 得 出 错误 的 结论 。 例 如 , 同一 组 AML 
患者 , 如 果 以 诊断 之 日 作为 研究 起 始点 , 其 中 位 生存 时 间 为 20 个 月 , 如果 以 化 疗 第 一 天 作为 起 
始点 , 则 中 位 生存 时 间 为 28 个 月 , 因为 有 一 部 分 患者 诊断 后 还 没有 来 得 及 化 疗 就 已 死亡 , 未 被 
纳入 研究 , 造成 结果 高 估 。 而 以 诊断 之 日 作为 起 始点 , 则 更 为 合理 。 

(二 ) 研究 对 象 的 来 源 和 分 组 

研究 对 象 要 具有 代表 性 , 能 代表 目标 疾病 的 人 群 。 若 病人 来 自 不 同 级 别 医院 , 其 疾病 预后 
可 能 不 同 。 如 果 研 究 对 象 全 部 来 自 三 级 医院 , 则 代表 性 较 差 , 因为 三 级 医院 的 患者 往往 病情 较 
重 且 接近 病程 后 期 , 预后 差 。 再 如 研究 对 象 来 自 某 地 区 各 种 级 别 医 院 , 通常 包括 了 各 种 型 别 及 
其 病情 严重 程度 各 异 的 病例 , 更 能 反映 出 目标 人 群 的 特点 , 因而 具有 较 好 的 代表 性 。 

研究 对 象 的 分 组 也 必须 遵循 可 比 性 原则 , 即 非 研 究 因 素 在 组 间 的 分 布 是 均衡 可 比 的 。 在 
评价 治疗 方案 对 预后 的 影响 时 , 尽量 做 到 随机 化 分 组 , 确保 两 组 除了 拟 研究 的 治疗 方案 外 , 其 
他 各 种 影响 预后 的 因素 能 够 相同 。 例 如 比较 分 子 靶 向 药物 吉 非 蔡 尼 和 常规 化 疗 作为 一 线 治 疗 
肺癌 的 长 期 疗效 , 应 该 对 新 诊断 的 肺癌 患者 随机 分 组 , 一 组 为 吉 非 蔡 尼 治疗 组 , 一 组 为 常规 
化 疗 组 , 保证 两 组 病情 特征 等 预后 因素 的 均衡 可 比 ,长 期 随访 并 同步 观察 DFS 和 0S 等 预后 
指标 。 

(三 ) 随访 和 失 访 

预后 研究 中 随访 工作 十 分 重要 , 要 尽量 随访 到 所 有 研究 对 象 , 失 访 率 越 低 越 好 。 如 失 访 率 
小 于 5% 一 般 可 以 接受 , 对 结果 的 影响 小 , 大 于 10% 应 引起 注意 , 若 超过 20% , 则 研究 结果 的 价 
值 不 大 , 这 是 因为 患者 失 访 会 造成 疾病 预后 信息 大 量 丢失 ,影响 预后 结果 的 可 靠 性 。 减 少 病例 
失 访 应 注意 以 下 数 点 : 加强 对 患者 及 其 家 属 宣传 、 强 调 随 访 的 重要 性 , 以 提高 随访 的 依从 性 ; 建 
立 健全 随访 管理 制度 , 做 到 专人 负责 、 定 期 随访 ; 建立 良好 的 医 患 关系 ,做 到 有 求 必 应 ,不 失信 
于 患者 ; 以 及 改进 随访 方式 、 体 现 人 文 关 怀 ,尽量 采用 关心 、 体 贴 的 调查 语言 等 。 

随访 期 限 视 疾病 病程 而 定 , 原则 上 要 有 足够 长 的 随访 时 间 , 以 便 能 观察 到 疾病 的 所 有 结局 ， 
包括 一 些 罕 发 的 不 良 反 应 。 随 访 间隔 时 间 的 确定 也 要 合理 , 以 便 能 动态 观察 到 各 种 变化 情况 。 
随访 间 期 不 同 , 可 导致 不 同 结论 。 例 如 同样 一 组 肺癌 患者 队列 , 如 果 观 察 间 期 分 别 定 为 2 个 月 
和 6 个 月 ,间隔 2 个 月 的 随访 可 能 更 容易 被 观察 到 肿瘤 的 进展 情况 , DFS 时 间 可 能 短 于 6 个 月 
的 患者 。 一 般 对 于 病程 短 的 疾病 , 随访 间隔 时 间 可 短 些 , 对 于 病程 长 的 疾病 , 随访 间隔 时 间 可 
适当 延长 。 随 访 过 程 中 确定 的 各 种 结局 , 一定 要 有 明确 的 定义 和 判断 标准 , 在 设计 时 就 应 规定 
好 ,执行 中 不 再 变动 ,标准 要 有 客观 性 ; 最 好 用 盲 法 观察 , 以 防止 测量 偏 倚 。 

对 失 访 者 的 处 理 可 采用 两 种 简单 的 方法 ,一 是 按 死 亡 计 ,或 者 直接 从 观察 患者 人 数 中 删除 ， 
不 予 统计 , 这 两 种 方法 均 损 失 预 后 的 信息 , 最 好 是 按照 本 章 第 四 节 介绍 的 生存 分 析 方 法 , 处 理 
失 访 病例 , 以 减少 信息 损失 。 对 有 失 访 病例 的 研究 , 可 采用 敏感 性 分 析 估 计 失 访 对 研究 结果 的 
影响 , 具体 方法 为 先 假定 失 访 者 均 出 现 预 定 结局 , 得 到 结局 事件 “最 高 " 发 生 率 , 然后 假定 失 访 
者 均 不 出 现 结局 事件 , 得 到 “最 低 ” 发 生 率 , 比较 “最 高 "和 “最 低 " 率 , 如 两 者 相差 不 大 . 则 结果 
可 取 , 如 两 者 相差 很 大 , 则 研究 结果 不 可 靠 。 例 如 , 有 100 例 研究 对 象 , 研究 结束 时 4 例 死亡 ， 
16 例 失 访 , 粗 病死 率 为 4.8%(4/84), 按照 最 坏 估 计 , 16 例 失 访 者 均 死亡 , 则 最 高 病死 率 为 20% 
(20/100), 按照 最 好 估计 , 16 例 失 访 者 均 存 活 , 则 最 低 病死 率 为 4%(4/100), 最 高 病死 率 20% 与 
粗 病死 率 4.8% 相差 很 大 , 认为 失 访 对 研究 结论 有 比较 大 的 影响 , 该 研究 结果 不 可 信 。 
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三 、 疾 病 预 后 研究 的 基本 步 又 


以 上 海 市 中 美白 血 病 协作 组 完成 的 623 例 AML 的 预后 研究 为 例 , 说 明 预 后 研究 的 基本 步 又。 

1. 确立 研究 的 疾病 、 研 究 目 的 ”研究 原 发 性 、 初 治 AML 的 预后 。 

2. 确定 观察 指标 、 研 究 因素 “结局 观察 指标 为 完全 缓解 率 , 3 年 复发 率 , 3 年 生存 率 , 中 位 
生存 时 间 , 分 析 影 响 生 存 的 预后 因素 。 

3. 确定 研究 方案 ”采用 前 瞻 性 队列 研究 的 设计 方案 进行 预后 研究 。 确 定 AML 的 诊断 标准 ， 
定义 0S 为 从 诊断 之 日 到 死亡 或 最 后 的 随访 之 日 , 确定 随访 终止 时 间 为 2008 年 5 月 1 日 。 

4. 收集 队列 信息 、 登 记 资料 “前 脆性 收集 2003 一 2007 年 的 上 海 市 白血病 协作 组 24 家 医院 
的 原 发 性 、 未 治疗 的 AML 患者 623 例 , 所 有 骨 介 标 本 统一 送 到 中 美 实验 室 进行 统一 诊断 , 以 防 
误诊 。 登 记 病例 信息 和 所 有 相关 的 实验 室 资料 , 包括 身份 证 号 码 、 联系 电话 、 地 址 、 主 管 医师 的 
联系 信息 等 。 

5. 随访 每 6 个 月 随访 一 次 , 同时 随访 患者 本 人 (或 家 属 ) 和 主管 医师 , 随访 内 容 包 括 症状 、 
体征 、 治 疗 方案 、 并 发 症 、 血 象 和 骨髓 检查 结果 。 多 种 途径 随访 对 减少 失 访 有 很 大 帮助 。 

6. 统计 分 析 ( 详 见 本 章 第 四 节 内 容 ) 

(1) 病例 一 般 资料 分 析 : 患者 年 龄 .性 别 、WHO 亚 型 、 染 色 体 等 资料 的 分 析 。 

(2) 完全 缓解 率 、 复 发 率 的 计算 。 

(3) 生存 率 、 中 位 生存 时 间 、 生 存 曲线 : 应 用 Kaplan-Meier 方法 计算 生存 率 , 绘制 生存 曲线 。 

(4) 单 因 素 分 析 : 应 用 Log-rank 方法 统计 与 生存 相关 的 预后 因素 , 得 出 与 预后 相关 的 因素 如 
WHO 亚 型 .染色 体 分 组 等 。 

(5) 多 因素 分 析 : 把 单 因素 分 析 中 P<0.1 的 预后 因素 纳入 COX 风险 比例 模型 进行 多 因素 预 
后 分 析 。 : 
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一 、 生 存 率 和 中 位 生存 时 间 分 析 

(一 ) 生存 率 的 计算 

在 生存 分 析 中 , 生存 率 的 计算 有 两 种 方法 : 直接 法 和 间接 法 。 

1. 直接 法 ”如 果 病例 数 多 , 没有 失 访 , 则 结果 可 靠 , 计算 简单 。 例 如 5 年 生存 率 = 活 满 5 年 
的 例 数 /总 随访 例 数 。 但 一 般 生存 数据 均 存在 删 失 值 (censored data), 也 称 为 终 检 值 、 稚 尾数 据 ， 
需要 用 间接 法 计算 生存 率 。 

2. 间接 法 ” 删 失 值 包括 三 种 情况 : @D 失 访 ; @ 死 于 其 他 疾病 ; @ 观 察 到 规定 的 随访 截止 时 
间 仍 存活 。 常 用 的 间接 法 包括 Kaplan-Meier 法 和 寿命 表 法 。 其 中 , 寿命 表 法 用 于 例 数 较 多 的 研 
究 , Kaplan-Meier 法 可 用 于 小 样本 研究 , 也 可 用 于 大 样本 的 研究 。 目 前 有 多 种 统计 软件 可 以 进 
行 生 存 分 析 , 不 需 手工 计算 。 

生存 曲线 是 以 随访 时 间 为 横 坐标 , 累积 生存 率 为 纵 坐标 作 图 即 为 生存 曲线 ,常用 的 Kaplan- 
Meier 曲线 , 表示 时 间 与 生存 关系 的 函数 曲线 。 随 访 时 间 单位 越 小 , 则 精密 度 越 高 , 即 生存 期 用 
月 计 比 年 计 为 佳 。 生 存 曲 线 分 析 能 获得 有 关 疾 病 过 程 任 何 时 刻 的 生存 率 , 信息 量 远 远 超过 点 估 
计 值 。 例 如 几 种 疾病 的 5 年 生存 率 相同 , 但 生存 曲线 却 大 不 相同 (图 11-2)。 小 样本 获得 的 曲线 
为 阶梯 形 , 而 大 样本 就 形成 光滑 的 曲线 。 应 用 间接 法 进行 生存 分 析 时 必须 注意 , 所 绘 生存 率 曲 
线 纵 坐 标 所 示 是 一 个 假想 队列 的 生存 概率 , 而 不 是 患者 实际 的 生存 率 , 因 左 侧 的 观察 病例 数 总 
比 右 侧 多 , 因此 曲线 左 侧 的 估计 值 较 右 侧 可 靠 。 
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生存 资料 需要 具备 以 下 几 个 要 素 才能 进行 生存 分 析 : 结局 、 随 访 开始 和 结束 时 间 、 研 究 因 
素 。 按 照 表 11-1 数据 格式 整理 后 , 可 便于 统计 分 析 。 随 访 开始 和 死亡 时 间 最 好 要 精确 到 天 ; 例 
如 最 后 随访 稚 止 日 期 为 2009 年 12 月 31 日 ( 表 11-1)。 多数 统计 软件 进行 生存 分 析 时 默认 事件 
发 生 为 1, 未 发 生 为 0。 


表 11-1 生存 分 析 数 据 整理 格式 





病例 编号 诊断 ” 随访 起 始 日 期 “死亡 或 截止 日 期 。” 结局 (死亡 =1) ”变量 1 变量 2 
1 1 2000/04/05 2005/05/06 1 1 2 
2 2 2004/03/02 2009/12/31 0 4 1 
3 1 2005/07/05 2009/12/31 0 3 
4 3 2003/06/01 2008/08/09 1 1 2 
5 4 2002/08/10 2009/12/31 0 4 2 


(二 ) 中 位 生存 时 间 的 计算 

预后 研究 中 还 需要 计算 生存 期 的 长 短 , 即 存活 期 。 常 用 总 体 中 位 生存 期 、 无 病 存 活期 (disease 
free survival, DFS )、 无 事件 存活 期 (event free survival, EFS )、 无 进展 存活 期 (progression free 
survival, PFS ) 等 来 表示 。 由 于 生存 时 间 是 一 种 呈正 偏 态 的 连续 变量 , 因此 要 计算 中 位 生存 期 ， 
不 能 计算 平均 生存 期 ; 鉴于 删 失 值 的 存在 , 只 能 用 生存 分 析 计算 中 位 生存 时 间 。 生 存 分 析 方 法 
可 以 处 理 截 尾数 据 。 

例如 ,有 12 例 患 者 , 8 例 死 亡 , 2 例 失 访 , 2 例 截 止 到 随访 日 尚 存活 , 生存 时 间 分 别 为 10、20、 
20、30、80、50、100、150、80”、10、120、200 个 月 ,按照 生存 分 析 计 算 中 位 生存 时 间 为 80 个 月 ， 
而 用 传统 方法 计算 该 组 数据 的 中 位 数 为 65 个 月 。 

二 、 疾 病 预 后 因素 的 研究 方法 

(一 ) 单 因 素 预 后 因素 分 析 

从 前 述 已 知 ,影响 疾病 预后 的 因素 很 多 , 包括 患者 一 般 情况 如 性 别 、 年 龄 .体质 和 营养 情 
况 、 社 会 经 济 和 心理 状况 等 ,疾病 本 身 的 情况 如 病理 组 织 学 类 型 、 病 灶 大 小 、 病 原 体 种 类 、 临 床 
分 期 等 , 治疗 方法 及 患者 、 医 护 人 员 的 依从 性 等 。 对 疾病 预后 因素 的 识别 和 研究 , 是 疾病 预后 
研究 中 另 一 项 重要 内 容 。 预 后 因素 的 研究 方法 和 疾病 危险 因素 的 研究 方法 相似 。 一 般 可 以 先 
从 回顾 性 的 临床 资料 中 进行 得 检 , 然后 通过 病例 对 照 研究 、 前 瞻 性 队列 研究 进一步 加 以 论证 ， 
从 而 确定 是 否 为 预后 因素 。 分 析 方 法 可 先 从 单 因素 分 析 开 始 , 然后 进行 多 因素 分 析 校正 各 种 混 
杂 因 素 ,一般 把 单 因素 分 析 中 P<0.1 的 预后 因素 纳入 多 因素 预后 分 析 。 

单 因素 分 析 常 用 的 统计 方法 是 Log-rank 分 析 , 并 以 Kaplan-Meier 生存 曲线 的 形式 来 直观 地 
展示 , 上述 12 例 患 者 男性 和 女性 的 预后 见 表 11-2 和 图 11-3, 说 明 女 性 预后 良好 。 单 因素 分 析 
中 P<0.1 的 因素 均 应 纳 人 多 因素 分 析 。 








表 11-2 ”采用 Log-rank 分 析 进行 单 因素 预后 分 析 








例 数 死亡 例 数 中 位 生存 时 间 ( 个 月 ) 万 值 P 值 
性 别 男 § 30 6.55 0.01 
女 3 和 150 











在 单 因素 研究 中 确定 某 因 素 是 否 系 预后 因素 时 , 必须 保证 观察 组 (存在 某 预 后 因素 ) 和 对 昭 
组 (不 存在 该 预后 因素 ) 两 组 的 临床 特点 和 其 他 非 研究 因素 都 要 相同 , 但 在 实际 工作 中 常 不 易 做 
到 。 所 以 单 因 素 分 析 结果 提示 某 个 有 意义 的 预后 因素 很 可 能 不 是 独立 的 预后 因素 。 为 了 尽量 
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图 11-3 不 同性 别 患者 的 Kaplan-Meier 生存 曲线 


减少 混杂 性 偏 倚 , 可 以 采用 下 列 方法 , 如 限制 、 配 比 、 分 层 及 标准 化 等 方法 加 以 平衡 。 如 有 多 个 
混杂 因素 , 应 该 进行 多 因素 分 析 。 

(二 ) 多 因素 预后 因素 分 析 

由 于 疾病 的 结局 和 多 种 预后 因素 有 关 , 各 种 预后 因素 又 是 互相 影响 的 , 为 了 全 面 正确 地 衡量 
预后 因素 的 作用 , 可 以 采用 多 元 回归 、 逐 步 回归 、logistic 回归 及 Cox 模型 等 多 因素 分 析 方 法 , 进 一 
步 筛选 出 与 疾病 结局 有 关 的 主要 预后 因素 , 以 建立 该 疾病 预后 函数 或 预后 指数 。1972 年 英国 统 
计 学 家 D.R. Cox 提出 一 种 能 处 理 多 因素 生存 资料 数据 的 回归 模型 ， 称 风险 比例 模型 ( proportional 
hazard model), 简称 Cox 回归 或 Cox 模型 。 在 队列 研究 中 应 用 最 广 , 可 以 允许 终 检 值 即 截 尾数 据 
的 存在 , 终 检 的 原因 可 能 是 死 于 其 他 原因 、 失 访 或 到 资料 总 结 时 随访 对 象 还 活着 但 尚未 发 生 所 规 
定 的 事件 。 同 时 Cox 模型 还 能 有 效 处 理 随访 时 间 长 短 不 一 及 资料 失 访 等 预后 研究 中 经 常 碰 到 的 
问题 , 难以 用 常规 统计 方法 解决 。 在 Cox 模型 中 , 在 时 点 ,除了 有 一 个 基本 (本 底 ) 风 险 量 ho(7) 
外 ,第 i 个 影响 因素 使 该 基本 量 加 (1) 增 至 e8 筷 倍 而 成 为 ia(DebX。 因 此 , 如 果 大 个 因素 同时 影 
响 生 存 过 程 , 在 时 点 1 的 风险 量 是 ho(1)x ef 名 XeP 名 xX…xeBXi。 所 以 Cox 模型 的 基本 结构 为 : 

h(t)=ho(t)x eBX x eBeXs XX eBiXs 式 (11-1) 

以 死亡 事件 为 例 , 则 公式 中 h(1) 表 示 在 时 点 t 的 死亡 率 , ho(1) 表 示 在 时 点 1 的 本 底 死亡 率 ， 
可 理解 为 在 时 点 :时 不 存在 总 ,万 ,…, 乐 的 影响 情况 下 的 死亡 率 ( 即 启 = 尺 =…= 有 =0 时 的 死亡 
率 ) ho(7)x efiX 表示 第 1 个 因素 名 所 产生 的 作用 , 使 死亡 率 和 (1) 增 至 (1)x ep ,Bi 可 理解 
为 六 的 回归 系数 。 

在 Cox 模型 作 分 析 时 , 可 估计 风险 比 (hazard ratio, HR), HR=ef, 其 意义 与 相对 危险 度 ( RR) 
相同 。 表 11-3 是 有 关 435 例 骨骼 增生 异常 综合 征 (MDS ) 的 预后 因素 分 析 , 年 龄 =60 岁 、 中 性 粒 






































表 11-3 ”骨髓 增生 异常 综合 征 Cox 模型 多 因素 预后 分 析 








因素 回归 系数 B HR( 95% Cl) z 值 P 值 
年 龄 ( >60 岁 ) 0.63 1.87( 1.38~2.54) 4.00 0.000 
中 性 粒 细胞 绝对 值 (<1.0x 10%L) 0.37 1.45( 1.05~2.01) 2.24 0.025 
血红 蛋白 (<90g/L) 0.87 2.38( 1.50~3.79) 3.66 0.000 
血小板 <30x 10%L 0.36 1.44( 1.06~1.95) 2.34 0.019 
IPSS 积分 分 组 0.74 2.10(1.71~2.56) 7.16 0.000 


WPSS 积分 分 组 0.19 1.22(0.90~1.50) 1.92 0.055 
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细胞 绝对 值 < 1.0 x 107L、 血 红 和 蛋白 <90g/L、 血 小 板 <30x 108/L、 国 际 预 后 积分 (IPSS ) 高 危 组 均 
是 影响 MDS 生存 的 独立 因素 , 例如 血红 蛋白 <90g/L 的 患者 与 血红 蛋白 >90g/L 的 患者 相 比 , 在 
校正 了 其 他 影响 因素 后 ,死亡 风险 增加 了 2.38 倍 。 


第 五 节 ”预后 研究 中 常见 的 偏 倚 及 其 处 理 方法 


一 、 预 后 研究 中 常见 的 偏 倚 


(一 ) 集合 偏 倚 (assembly bias) 

集合 偏 倚 或 称 分 组 偏 倚 、 就 诊 偏 倚 、 易 感性 偏 倚 (susceptibility bias), 属于 选择 性 偏 倚 。 由 
于 各 医院 的 性 质 和 任务 不 同 , 收治 的 患者 在 病情 、 病 程 和 临床 类 型 可 能 不 同 ; 就 诊 患者 的 经 济 
条 件 在 不 同 地 区 也 可 能 有 所 不 同 , 影响 了 疾病 的 早期 诊治 。 在 集合 队列 进行 随访 , 随访 结束 时 
发 现 预后 不 同 可 能 并 非 研 究 因素 所 致 。 








潜在 的 偏 倚 样本 偏 倚 ” 易 感 性 偏 倚 ”迁移 偏 倚 ”测量 偏 倚 
图 11-4 ”队列 研究 中 常见 的 偏 倚 


(二 ) 存活 队列 偏 倚 (survival cohorts bias) 

从 各 医院 收集 病例 组 成 队列 进行 预后 研究 , 并 非 都 是 起 始 队列 (inception cohort), 而 是 该 病 
病程 中 某 一 时 点 进入 的 存活 病例 , 故 称 存活 队列 偏 倚 ( 图 11-5), 那些 未 入 院 的 失 访 病例 , 因 信 
息 丢 失 , 造成 预后 失真 。 比 如 心肌 梗死 , 可 能 出 现 入院 前 死亡 , 造成 实际 人 院 病例 的 病情 较 轻 ， 
从 而 高 估 预 后 。 车 采用 起 始 队 列 进行 研究 ,集合 队列 150 例 , 随访 结果 时 , 预后 好 的 75 例 , 预 


真实 队列 观察 到 的 好 转 率 ”实际 好 转 率 
结局 
集合 队列 
(N=150) 好 转 : ”75 例 De 0 
未 好 转 : 75 例 
存活 队列 
结局 
随访 队列 
未 好 转 : 10 例 
未 随访 失 访 
(N=100) 好 转 : ”35 例 
未 好 转 : 65 例 
图 11-5 ”存活 队列 偏 倚 





浊 
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后 不 好 的 75 例 ,各 占 50%; 若 以 医院 存活 病例 组 成 队列 , 假如 有 50 例 , 其 中 预后 好 的 40 例 , 预 
后 差 的 10 例 (20% ), 前 者 占 80%(40/50), 而 未 被 随访 到 的 100 例 中 预后 好 的 35 例 , 预后 不 佳 65 
例 , 占 65%(65/100), 估计 的 预后 不 良 率 分 别 为 20% 和 65%, 而 真 值 却 为 50% , 出 现 严重 偏差。 
因此 ,存活 队列 偏 倚 实 际 上 也 是 集合 偏 倚 的 一 种 特殊 类 型 。 

(三 ) 失 访 偏 倚 (lost to follow-up) 

由 于 观察 时 间 长 , 观察 对 象 因 迁 移 、 外 出 、 不 愿 继续 合作 、 因 药物 不 良 反应 而 停止 治疗 或 死 
于 非 终点 疾病 等 原因 脱离 了 观察 , 即 失 访 , 造成 的 偏差 , 称 失 访 偏 倚 , 属于 选择 性 偏 倚 , 在 预后 
研究 中 尤为 常见 。 如 一 项 预后 研究 中 , 有 100 例 病 人 进入 随访 观察 , 但 最 后 有 20% 病人 失 访 ， 
其 中 随访 完整 的 80 例 病例 的 疗效 为 80%。 倘 若 失 访 20 例 的 疗效 也 为 80%, 那么 该 研究 的 实际 
疗效 为 80%, 相反 若 20 例 中 有 效 的 仅 占 20%, 则 实际 疗效 为 68%。 可 见 失 访 偏 倚 可 使 研究 结果 
严重 失真 。 

(四 ) 零 时 不 当 偏 倚 

若 研 究 对 象 开始 观察 的 起 始 时 刻 不 一 致 ,分 别处 在 该 疾病 病程 的 不 同 阶 段 而 产生 的 偏差 ， 
称 零 时 不 当 偏 傈 。 如 随访 观察 肾 结 石 的 复发 率 , 住院 病人 由 于 观察 的 零 时 刻 不 同 , 若 将 初 发 与 
复发 混在 同一 组 去 观察 预后 , 显然 过 高 估计 复发 率 。 

(五 ) 迁移 性 偏 倚 (migration bias) 

随访 观察 期 间 患者 退出 、 失 访 或 从 一 个 队列 移 至 另 一 个 队列 等 各 种 变动 引起 的 一 种 偏 倚 。 
变动 的 人 数 过 多 、 队 列 不 稳定 必然 会 影响 结果 的 真实 性 。 

(六 ) 测量 偏 佑 (measurement bias) 

观察 与 评定 结局 过 程 中 所 发 生 的 偏 倚 。 有 些 结局 指标 , 如 死亡 、 脑 血管 意外 、 某 些 肿瘤 , 诊 
断 十 分 明确 , 不 容易 遗漏 ; 倘若 结局 为 特殊 死因 、 亚 临床 疾病 、 不 良 反应 、 残 疾 等 就 不 那么 清楚 ， 
判断 或 有 出 人 , 从 而 影响 结果 。 事 先 制定 严格 的 、 可 行 的 结局 判断 标准 ,采用 育 法 评定 结局 , 可 
以 减少 测量 偏 倚 。 

(七 ) 混杂 偏 倚 (confounding bias) 

在 研究 某 因素 是 否 为 预后 因素 时 ,理论 上 必须 保证 观察 组 (存在 某 预 后 因素 ) 和 对 照 组 (不 
存在 该 预后 因素 ) 两 组 的 临床 特点 和 其 他 非 研 究 因素 都 要 相同 , 但 在 实际 工作 中 常 难 以 做 到 。 


二 、 偏 倚 的 处 理 方法 











lt 


(一 ) 随机 化 (randomization) 

从 理论 上 讲 , 两 个 队列 进行 比较 ， 应 当 除 研究 的 预后 因素 外 , 其 他 因素 最 好 组 间 均 衡 , 即 基 
线 状 况 要 相同 。 随机 化 分 组 是 消除 选择 性 偏 倚 最 好 的 方法 ， 可 使 每 个 研究 对 象 都 有 同等 的 机 会 
进入 观察 队列 和 对 照 队列 , 实现 两 组 可 比 。 

(二 ) 限制 (restriction) 

在 选择 研究 对 象 时 , 可 事先 设置 一 些 限制 条 件 , 以 排除 其 他 一 些 已 知 影响 因素 对 结果 的 干 
扰 。 如 研究 年 龄 是 否 系 急性 心肌 梗死 的 预后 因素 ， 可 将 研究 对 象限 制 在 黄种 人 、 男 性 、 无 并 发 
症 的 前 壁 心肌 梗死 病人 , 这 样 就 可 以 排除 种 族 、 性 别 、 心 肌 梗 死 部 位 和 并 发 症 等 因素 的 干扰 和 
影响 ， 分 析 年 龄 对 急性 心肌 梗死 预后 的 真实 作用 。 但 用 此 法 控制 偏 倚 , 其 预后 结果 常 有 很 大 的 
局 限 性 , 结论 外 推 性 差 。 

(三 ) 配 比 (matching) 

配 比 就 是 为 观察 组 的 每 一 个 研究 对 象 匹配 一 个 或 几 个 类 似 的 对 照 , 旨 在 消除 这 些 配 比 因素 
对 结果 的 潜在 影响 。 预 后 研究 中 多 以 年 龄 /性 别 和 种 族 作为 配 比 因素 , 因为 这 些 因素 也 是 最 党 
见 的 混杂 因素 。 除 此 之 外 , 像 疾 病 严 重 程度 、 既 往 治疗 史 等 也 用 来 配对 。 但 千 万 不 能 把 研究 因 
素 作为 配对 条 件 。 
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(四 ) 分 层 (siratification) 

分 层 常 是 最 常用 的 检 出 和 控制 偏 倚 方 法 , 特别 是 有 潜在 的 混杂 偏 傈 时 , 应 用 分 层 方法 可 以 
在 研究 设计 和 资料 分 析 阶 段 有 效 控制 偏 倚 。 例 如 A、B 两 个 医院 冠 心病 搭桥 术 后 病死 率 比 较 
( 表 11-4), A 医院 粗 病 死 率 为 4%, 高 于 B 医院 的 2.6%, 认为 A 医院 手术 风险 高 。 但 如 果 以 术 前 
危险 度 进行 分 层 , 重新 计算 各 层 内 的 标 化 死亡 率 , A 和 B 医院 又 是 相同 的 , 为 什么 会 出 现 这 伴 的 
结果 呢 ? 主 要 是 因为 两 所 医院 病人 的 病情 构成 不 同 , A 医院 高 危 病例 较 多 , 而 B 医院 低 危 病例 
较 多 , 分 层 分 析 消 除了 病情 构成 这 个 混杂 因素 的 影响 。 


表 11-4 分 层 分 析 案 例 




















入 医院 日 医院 
标 化 标 化 
病死 
危险 度 。 病人 数 。 死亡 数 率 病 元 率 ”病人 数 。 死亡 数 ”病死 率 。 病死 
(%) 2 (%) 
(%) (%) 
高 500 30 6 400 24 6 
承 400 16 4 800 32 4 
低 300 2 0.67 1200 8 0.67 
se 1200 48 4 3.6 2400 64 2.6 3.6 





注 : 两 所 医院 冠 心 病 搭桥 术 后 病死 率 , 以 术 前 病情 严重 程度 分 层 


(五 ) 标准 化 (standardization) 

当 比 较 两 个 率 时 , 若 两 组 对 象 内 部 构成 存在 差别 是 足以 影响 结论 时 , 可 用 标准 化 率 校正 。 最 简 
单 的 方法 就 是 假设 两 组 的 内 部 构成 或 权重 相同 , 计算 加 权 率 。 表 11-4 中 A 医院 和 医院 的 标 化 病 
死 率 =(1/3x6%)+(13x4%)+(13x0.67%)=3.6%, 每 组 的 内 部 构成 均 为 1:1:1, 即 权重 均 为 1/3。 

(六 ) 多 因素 分 析 方 法 
在 预后 因素 研究 中 , 常 有 多 个 预后 因素 同时 影响 结局 , 此 时 应 借助 多 因素 分 析 方 法 , 从 中 
筛选 出 与 疾病 结局 有 关 的 主要 预后 因素 , 探讨 这 些 因素 对 预后 的 作用 大 小 。 在 预后 因素 研究 中 
以 比例 风险 模型 -Cox 回归 分 析 方 法 最 为 常用 。 


第 六 节 ”疾病 预后 研究 的 评价 原则 


对 疾病 预后 研究 的 评价 , 同样 包括 三 个 方面 : 真实 性 、 重 要 性 和 适用 性 。 具 体 评价 原则 和 
标准 可 归纳 为 以 下 九条 ( 表 11-5): 
表 11-5 ”预后 研究 文献 的 评价 原则 




















一 、 真 实 性 
1. 队列 的 起 始点 是 否 相同 ? 
2. 队列 是 否 有 代表 性 ? 
3. 随访 是 否 足够 长 ,是 否 完整 ? 
4 判断 结局 时 是 否 有 客观 的 结局 标准 ,是否 采用 讶 法 ? 
5. 是 否 对 影响 预后 研究 的 重要 因素 进行 了 统计 学 的 校正 ? 
二 、 重 要 性 
1. 预后 研究 的 结果 报告 是 否 完整 ? 
2. 研究 结果 的 精确 性 如 何 ? 即 可 信 区 间 是 否 较 罕 ? 
三 、 适 用 性 
1. 我 们 自己 的 病人 是 否 与 文献 报道 的 病人 非常 不 同 ? 
2. 研究 结果 是 否 有 助 于 治疗 方案 的 制定 和 是 否 有 助 于 对 患者 及 其 亲属 作出 解释 ? 
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一 、 观 察 顶 后 的 研究 对 象 是 否 都 处 于 同一 起 始 队 列 
预后 研究 要 求 各 队列 研究 对 象 的 预后 观察 起 始点 _ 定 要 统一 ， 可 以 是 症状 首发 时 间 、 疾 病 
确诊 时 间或 治疗 开始 时 间 ， 零点 时 间 务必 明确 一 致 。 如 研究 脑 卒 中 的 预后 因素 , 纳入 的 研究 对 
象 应 是 首次 发 作 的 脑 罕 中 患者 ,排除 复发 者 。 对 入 选 的 研究 对 象 处 于 病程 的 哪 一 个 阶段 必须 清 
楚 叙 述 。 零 点 时 间 最 好 是 处 于 病程 的 早期 , 即 起 始 队 列 ( inception cohort)。 如 研究 AML 的 生存 
时 间 , 就 是 统一 以 诊断 之 日 为 零点 时 间 ， 不 能 有 的 是 诊断 时 间 , 而 有 的 又 是 以 开始 化 疗 为 起 点 
时 间 。 


一 、 研 究 对 象 是 否 能 代表 被 研究 疾病 的 目标 人 群 
研究 对 象 应 有 明确 的 诊断 标准 、 纳 入 /排除 标准 。 对 研究 对 象 的 来 源 机 构 、 来 源 地 应 作 详 


细 叙 述 , 以便 了 解 研究 对 象 的 代表 性 , 判断 是 知 存在 选择 性 偏 倚 。 对 研究 对 象 的 一 般 特 征 包括 
年 龄 \ 性 别 \ 疾 病 关 重度 和 有 否 并 发 症 存在 等 也 应 详细 介绍 , 因为 这 些 因素 都 和 预后 有 关 。 





三 、 随访 时 间 是 否 足 够 ”随访 是 否 完整 

随访 时 间 必 须 是 够 长 ,以 便 发 现 关注 的 研究 结果 。 如 果 随 访 时 间 过 短 , 发 生 了 结局 事件 (如 
肿瘤 发 生 .康复 、 复 发 等 ) 的 患者 中 只 有 一 小 部 分 被 发 现 , 难以 反映 该 疾病 预后 的 真实 情况 。 

同时 随访 必须 充分 、 完 整 。 在 理想 情况 下 , 所 有 纳入 研究 对 象 的 观察 应 由 始 至 终 , 即 从 疾病 
早期 一 直 随访 到 完全 康复 、 复 发 或 死亡 ， 但 事实 上 难以 做 到 , 失 访 不 能 完全 人 避免。 如 何 来 判断 
失 访 对 结论 的 影响 , 一 般 遵 从 “5 和 20” 原则 , 失 访 率 <5%, 其 研究 结果 可 靠 , 如 失 访 率 >20%， 
结果 真实 性 将 大 打折 扣 , 若 失 访 率 在 5%~20% 之 间 , 则 结果 较 可 靠 。 亦 可 通过 前 述 的 敏感 性 分 
从 ,比较 最高" 和“ 最低" 发 生 率 , 如 两 者 相差 不 大 , 则 结果 可 信 , 如 两 者 相差 很 大 , 则 研究 结果 
不 可 信 。 








四 、 判 断 结 局 有 无 客观 标准 ,是 否 采用 了 讶 法 
观察 疾病 预后 的 终点 , 即 结局 , 应 有 客观 的 标准 。 在 研究 开始 前 , 研究 者 必须 对 结局 有 明 
确 的 定义 ,同时 变 有 客观 的 测量 标准 。 有 些 预 后 容易 确定 , 如 死亡 , 但 大 多 数 结局 , 如 痉 愈 . 残 
疾 复发 .生存 质量 改变 等 ,都 需要 有 客观 的 标准 , 以 避免 判断 预后 结局 时 出 现 分 歧 ,影响 结 
论 。 铬 预后 结局 属 “ 硬 "指标 ,如 “死亡 " “残疾 " 等 可 不 用 宦 法 判断 , 倘若 结局 属 “ 软 " 指标 ,如 
一 过 性 脑 缺 血 、 不 稳定 性 心绞痛 pF 则 应 采用 讶 法 判断 ， 以 避免 发 生 疑 诊 偏 倚 (diagnostic-suspicious 
bias ) 以 及 预期 偏 倚 (expectation bias ) 等 。 





五 、 是 否 对 影响 预后 研究 的 重要 因素 进行 了 统计 学 的 校正 
预后 研究 中 可 能 存在 各 种 混杂 因素 , 应 对 这 些 因素 进行 统计 学 校正 。Framingham 的 研究 者 
报道 风湿 性 心脏 病 心房 辣 动 病人 的 脑 卒中 发 生 率 为 41/1000 人 年 , 与 非 风湿 性 心脏 病 心房 颜 动 
病人 的 脑 谷中 发 生 率 十 分 接近 , 但 进一步 研究 发 现 风湿 性 心脏 病 患者 的 年 龄 普遍 年 轻 。 对 患者 
的 年 龄 .性 别 和 高 血压 状态 进行 统计 学 校正 后 , 风湿 性 心脏 病 心房 颜 动 病人 脑 荃 中 的 发 生 率 是 
非 风 湿性 心脏 病 心房 颜 动 病人 的 6 倍 。 
校正 方法 包括 最 简单 的 分 层 分 析 以 及 较 复杂 的 诸如 logistic 回归 及 Cox 模型 等 多 因素 分 析 法 。 


六 、 荐 后 研究 的 结果 报告 是 否 完整 


比如 报告 生存 率 有 三 种 方法 : 某 一 时 间 点 的 生存 率 , 如 1 年 生存 率 .5 年 生存 率 等 ; @ 中 
位 生存 时 间 (median survival time ), 即 观察 到 50% 的 研究 对 象 死亡 的 随访 时 间 ; @ 生 存 曲 线 
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(survival curves ) 可 以 了 解 预 后 可 随时 间 而 变化 。 完 整 的 结果 报告 应 当 同 时 报告 某 一 时 点 的 生存 
率 、 中 位 生存 时 间 以 及 生存 曲线 , 否则 可 能 出 现 挂 一 漏 万 的 情况 。 例 如 , 某 研究 中 两 组 的 1 年 生 
存 率 都 是 20%, 但 二 者 的 生存 曲线 形态 可 以 完全 不 同 , 一 条 显示 中 位 生存 时 间 为 3 个 月 , 提示 疾 
病 早 期 预后 就 很 差 , 另 一 条 显示 中 位 生存 时 间 为 9 个 月 , 提示 疾病 早期 预后 好 。 


七 、 研 究 结果 的 精确 性 如 何 
除了 报告 生存 率 .生存 时 间 、 生 存 曲线 , 还 应 提供 预后 估计 的 精确 度 , 即 预后 结局 概率 的 
95% 可 信 区 间 。 对 预后 因素 的 研究 可 用 相对 危险 度 和 绝对 危险 度 等 来 表示 , 同时 也 要 报告 95% 
可 信 区 间 。95% CI 较 窄 , 说 明 样本 量 足够 大 , 对 总 体 预后 的 估计 更 精确 。 


八 、 我 们 自己 的 病人 是 下 与 文献 报道 的 病人 非常 不 同 


临床 上 是 否 可 以 采纳 文献 报道 的 结果 , 还 要 关注 我 们 的 病人 与 文献 报道 的 研究 对 象 是 否 在 
年 龄 .性别 .疾病 特征 等 方面 相似 或 存在 设 大 的 不 同 ” 如 果 差 别 不 大 , 就 可 以 考虑 应 用 这 些 研 
究 结果 。 


九 、 研 究 结果 是 否 有 助 于 治疗 方案 的 制订 和 是 否 有 助 于 
对 吉首 及 其 亲属 作出 解释 


研究 结果 是 否 直接 有 助 于 治疗 方案 的 取舍 ?例如 在 非 风湿 性 心房 颤动 病人 中 应 用 华 法 林 
抗 凝 治疗 , 能 降低 缺 血性 脑 卒 中 的 发 生 率 .但 在 男 一 项 “孤立 性 心房 颤动 "病人 (60 岁 以 下 , 无 相 
关 的 心肺 疾病 ) 的 研究 中 .15 年 内 脑 座 中 发 生 率 仅 为 1.3%, 长 期 应 用 华 法 林 可 能 喧 大 于 利 ,该 
研究 对 确定 华 法 林 搞 况 治 疗 的 取舍 有 重要 临床 价值 

研究 结果 是 否 有 助 于 对 患者 及 其 亲属 作出 解释 ?例如 一 项 高 质量 的 研究 结果 显示 疾病 的 
预后 良好 , 则 有 助 于 向 焦虑 的 病人 及 其 家 属 作出 解释 而 使 其 放心 。 另 一 方面 , 若 一 项 质量 高 的 
研究 结果 显示 疾病 预后 不 良 , 也 可 与 病人 和 其 家 属 进行 沟通 ,同样 具有 实用 价值 。 








第 七 节 。 循 证 实践 及 案例 分 析 


` 疾 病案 侈 


男性 患者 , 40 岁 ,确诊 为 急性 句 系 白血病 (AML)M4 亚 型 1 个 月 , 染色 体 正常 核 型 ,已 经 给 
予 标 准 DA 方案 ( 柔 红 霉 素 + 阿 糖 胞 昔 ) 诱 导 缓解 (CR ). 缓解 后 准备 给 予 缓解 后 的 巩固 强化 治 
疗 。 缓 解 后 的 项 固 强 化 治疗 非常 重要 , 正确 治疗 可 以 减少 复发 , 延长 生存 期 。 缓 解 后 治疗 可 以 
采用 多 种 标准 剂量 化 疗 药物 组 合 的 常规 方案 , 也 可 以 用 大 剂量 阿 糖 胞 并 (Ara-C) 单 药 治疗 , 到底 
何 种 治疗 方案 更 好 , 复发 率 低 , 生存 期 长 呢 ? 即 哪 种 治疗 方法 可 以 提高 AML 患者 的 预后 ? 


二 提出 问题 


采用 PICO 方式 提出 临床 问题 ;对 于 AML 患者 而 言 , 缓解 后 应 用 标准 化 疗 方案 和 应 用 大 剂 
量 Ara-C 化 疗 方案 进行 巩固 强化 治疗 ,复发 率 、 生 存 率 、 生 存 时 间 何 种 治疗 更 佳 ? 不 良 反应 是 否 
可 以 耐 受 ? 






三 、 证 据 检索 与 评价 


首先 以 (acute myeloid leukemia )AND(high dose cytarabine )AND(overall survival ) 为 检索 式 ， 
限定 在 “Title/abstract” 和 “Meta analysis”, 未 检索 到 相关 的 meta 分 析 。 重 新 检索 , 把 检索 条 件 限 
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定 在 “Title/abstract” 和 “Randomized Controlled Trial” 和 近 5 年 的 文献 , 检索 到 20 篇 
读 题 目 和 摘要 ,选择 最 新 的 、 祥 本 车 较 太 、 多 中 心 研究 、 随 访 时 间 较 长 .发表 在 影 1 
文献 杂志 , 阅读 全 文 , 按照 预后 文献 评价 原则 进行 文献 评价 。 


(一 ) 文献 基本 内 容 


1. 文献 题目 A randomized comparison of 4 courses of standard-dose multiagent chemotherapy 
versus 3 courses of high-dose cytarabine alone in postremissiontherapy for acute myeloid leukemia in 


adults: the JALSGAML201 Study. 


2. 文献 来 源 Blood, 2011, 117: 2366-2372. 


3. 研究 目的 ”在 年 岭 <65 岁 的 AML 患者 获得 第 一 次 完全 缓解 (CR ) 后 , 比较 2 种 治疗 方案 
对 患者 预后 的 影响 。 一 种 方案 为 4 个 疗程 的 标准 剂量 、 多 种 化 疗 药物 组 合 的 传统 方案 (CT), 另 
一 种 方案 为 3 个 疗程 的 大 剂量 Ara-C( HiDAC )。 
4. 研究 设计 “为 随机 对 照 临床 试验 , CONSORT 流程 图 见 图 11-6。2001 年 12 月 ~2005 年 
12 月 期 间 共有 1057 例 新 诊断 的 AML 符合 纳入 标准 , 年 龄 15~64 岁 ,来 自 129 个 研究 中 心 。 第 
一 次 随机 分 组 .分别 用 IDA+ Ara-C 和 DNR+ Ara-C 诱导 缓解 方案 进行 诱导 治疗 , 共有 823 例 患 
者 取得 CR, CR 后 再 次 随机 分 组 , 分别 用 4 个 疗程 的 大 剂量 Ara-C 和 3 个 疗程 的 标准 传统 方案 ， 
42 例 患 者 因为 各 种 原因 未 参加 第 二 次 随访 分 组 。 中 位 随访 时 间 为 48 个 月 (5~78 个 月 )。 第 一 次 
随机 化 后 的 观察 指标 是 CR ,第 二 次 随机 化 后 的 主要 观察 指标 是 DFS, 次 要 观察 指标 是 0S 和 3 
级 以 上 的 不 良 反应 。DFS 定义 为 从 CR 的 第 一 天 开始 到 白血病 复发 或 各 种 原因 死亡 , 0S 定义 为 
从 白血病 诊断 的 第 一 天 到 各 种 原因 死亡 。Kaplan-Meier 法 估计 DFS 和 0S, 单 因素 预后 分 析 采 用 
Log-rank 方法 , 多 因素 预后 分 析 采 用 Cox 回归 模型 。 









IDA+Arac-C 
(n=532) 


CR: 416(78%) 


大 剂量 Arac-C 
(HiDAC) 
(n=389) 






11-6 CONSORT 流程 图 


5. 研究 结果 ”HiDAC 组 和 CT 组 的 5 年 DFS 分 别 为 43% 和 39%(P=0.724),5 年 0S 分别 为 
58% 和 56%(P 了 =0.954)( 见 彩 图 11-7)， 在 染色 体 预后 良好 组 , HiDAC 组 和 CT 组 的 5 年 DFS 分 
别 为 57% 和 39%(P=0.050), 5 年 Os 分 别 为 75% 和 66%(P=0.174)( 见 彩 图 11-8)。 在 染色 体 预 
后 中 等 和 不 良 组 中 , 两 组 的 DFS 和 0S 无 统计 学 差异 。 

应 用 Cox 回归 模型 进行 多 因素 预后 分 析 , 对 于 DFS 而 言 ,发病 时 白细胞 =20 x 10%L、 诱 导 疗 
程 数 2 次 .年 龄 > 50 岁 为 独立 的 预后 因素 , 校正 了 这 些 因素 后 缓解 后 的 强化 方案 (应 用 传统 化 








新 诊断 AML 
(n=1057) 











随机 分 组 
未 参加 随机 分 组 :42 例 (5%) 
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疗 ) 并 非 独 立 的 预后 因素 。 对 于 0S 而 言 ,年 龄 >50 岁 、 诱 导 疗 程 数 2 次 、 发 病 白细胞 =>20 x 10/L、 


原始 细胞 过 氧化 物 酶 ( MPO ) 阳 性 率 <50% 为 独立 的 预后 因素 , 而 校正 了 这 些 因素 后 缓解 后 的 强 
化 方案 不 是 独立 的 预后 因素 ( 表 11-6)。 


表 11-6 应 用 COX 回归 进行 多 因素 预后 分 析 


变量 分 类 HR P 值 

DFS 

发 病 时 WBC 计数 >20x10%/L 1.49 <0.0001 

诱导 绥 解 次 数 2 个 疗程 1.50 0.0006 

年 龄 >50 岁 1.33 0.0028 

强化 方案 传统 化 疗 1.04 0.7128 
OS 

年 龄 >50 岁 2.00 <0.0001 

诱导 缓解 次 数 2 个 疗程 1.58 0.0033 

发 病 时 WBC 计数 >20 x 10%/L 1.41 0.0070 

MPO 阳性 的 原始 细胞 比例 <50°% 1.42 0.0149 

强化 方案 传统 化 疗 0.96 0.7768 








DFS: 无 病 生存 ; WBC: 白细胞 ; 0S: 总 体 生存 ; MPO: 过 氧化 物 酶 
在 HiDAC 组 ,白细胞 减少 更 明显 ,持续 时 间 更 长 ,感染 率 更 高 ( 表 11-7)。 


表 11-7 两 组 不 良 反应 发 生 情况 比较 

















大 剂量 Ara-C 组 传统 化 疗 组 PP 值 
第 一 次 化 疗 后 最 低 白细胞 (x 10%L) 0.17 0.40 <0.0001 
第 一 次 化 疗 后 白细胞 <1.0x 10 儿 持续 时 间 ( 天 ) 13(0-40) 12(0~36) 0.0005 
感染 发 生 率 (%) 20.9 14.5 <0.001 
出 血 发 %) 0.8 0.7 0.601 
30 天 死亡 率 (%) 0.9 0.6 0.389 





6. 结论 ”完全 缓解 后 , 传统 化 疗 与 大 剂量 Ara-C 治疗 的 疗效 相当 。 在 染色 体 预 后 良好 的 患 
者 中 HiDAC 的 DFS 优 于 传统 化 疗 。 

(二 ) 文献 评价 

1. 观察 预后 的 研究 对 象 是 否 都 处 于 同一 起 始 队列 “是 。 和 急性 白血病 均 为 原 发 性 、 新 诊断 的 
病例 , 排除 了 继 发 性 白血病 和 复发 难 治 的 病例 ,该 文 对 DFS 和 0S 有 明确 的 定义 , DFS 定义 为 
从 CR 的 第 一 天 开始 到 白血病 复发 或 各 种 原因 死亡 , 0S 定义 为 从 白血病 诊断 的 第 一 天 到 各 种 原 
因 死 亡 。 

2. 研究 的 对 象 是 否 能 代表 被 研究 疾病 的 目标 人 群 ”是 。 该 研究 为 多 中 心 研 究 , 研究 对 象 来 
自 129 个 研究 单位 , 1000 多 例 病 例 , 样本 量 大 , 代表 性 好 。 诊 断 标准 明确 , 在 各 个 研究 中 心 诊断 
后 ,有 一 个 专门 的 专家 小 组 复核 每 一 例 纳入 病例 的 血 片 和 骨髓 片 , 确保 诊断 的 准确 性 。 研 究 设 
计时 计算 了 样本 量 , 使 把 握 度 达到 80% 以 上 。 

3. 随访 时 间 是 否 足够 ? 随访 是 否 完整 是。 该 研究 中 位 随访 时 间 为 48 个 月 (5~78 个 月 )， 
从 图 11-7 可 以 估计 中 位 DFS 约 为 20 个 月 , 但 尚 不 能 得 出 中 位 0S 时间, 对 于 主要 观察 指标 DFS 
而 言 随访 时 间 足 够 , 但 对 于 次 要 观察 指标 0S 而 言 , 随访 时 间 尚 不 够 。 该 文 没有 直接 报道 失 访 
率 , 根据 文章 描述 ,所 有 患者 均 有 完整 的 随访 结果 。 

4. 判断 结局 有 无 客观 标准 , 是 否 采用 了 盲 法 ”是 。 观 察 结局 为 CR、DFS、OS 和 不 良 反应 ， 
均 有 明确 的 定义 。 因 为 观察 指标 为 客观 的 指标 , 不 容易 产生 测量 性 偏 傈 , 允许 不 采用 盲 法 。 








笔记 
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5. 是 否 对 影响 预后 研究 的 重要 因素 进行 了 统计 学 的 校正 ”是 。 应 用 了 Cox 回归 模型 进行 
了 多 因素 的 分 析 , 对 影响 预后 的 主要 因素 进行 了 校正 。 

6. 预后 研究 的 结果 报告 是 否 完整 ”是 。 报道 了 CR 率 、 复 发 率 、DFS、OS, 采 用 Kaplan-Meier 
生存 曲线 形式 展示 了 结果 , 也 报道 了 Cox 回归 分 析 后 的 HR 值 各 P 值 。 没 有 报道 具体 的 中 位 生 
存 时 间 , 但 读者 可 以 根据 生存 曲线 进行 估计 。 

7. 研究 结果 的 精确 性 如 何 不 能 确定 。 没 有 报道 95% C7, 特别 是 表 10-6 中 HR 应 该 同时 写 
出 HR 的 95% C7。 

8. 我 们 自己 的 病人 是 否 与 文献 报道 的 病人 相似 或 非常 不 同 该 研究 为 多 中 心 .大 样本 量 研 
究 , 亚洲 日 本 病人 , 与 我 们 中 国 病人 应 该 相似 . 不 会 有 很 大 的 人 种 差异 。 

9. 研究 结果 是 否 有 助 于 治疗 方案 的 制订 和 是 否 有 助 于 对 患者 及 其 亲属 作出 解释 ”是 。 该 
结果 对 临床 医生 提供 了 治疗 决策 , 有 助 于 对 患者 进行 解释 。 

总 体 而 言 , 该 研究 结论 可 信 , 有 临床 应 用 价值 , 可 以 指导 患者 的 治疗 。 


四 .实践 决策 
我 们 的 AML 患者 染色 体 正常 ,属于 染色 体 预 后 中 等 组 , 应 用 HiDAC 和 传统 化 疗 可 以 取得 
相 类 似 的 长 期 预后 , 所 以 两 种 治疗 方案 均 可 以 选择 。 与 患者 及 其 家 属 充分 沟通 后 , 患者 采用 
HiDAC 进行 缓解 后 的 强化 治疗 。 但 应 用 1 个 疗程 后 白细胞 达到 粒 细 胞 缺乏 、 严 重 感染 , 以 后 换 
用 了 传统 的 化 疗 , 直至 缓解 后 强化 治疗 结束 , 患者 持续 缓解 之 中 。 


五 .小 结 


循 证 医学 证 据 的 最 高 级 别 是 meta 分 析 和 RCT, 其 次 是 前 脆性 队列 研究 , 该 研究 采用 RCT 的 
研究 方法 进行 随机 分 组 , 保证 了 两 组 的 可 比 性 , 再 结合 前 脆性 队列 的 方法 进行 长 期 随访 , 随访 
率 高 , 得 出 比较 可 靠 的 结论 , 指导 临床 决策 。 患 者 应 用 HiDAC 后 出 现 严重 感染 , 因为 有 循 证 医 
学 证 据 支持 传统 的 常规 化 疗 也 可 以 取得 相似 的 疗效 , 所 以 我 们 敢于 换 用 常规 化 疗 , 事实 证 明 患 
者 取得 了 很 好 的 效果 。 

















( 王 小 钦 ” 林 果 为 ) 
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20 世纪 90 年 代 初 期 ,美国 医学 研究 所 正式 提出 了 临床 实践 指南 (clinical practice guideline， 
CPG ) 的 概念 , 经 过 20 多 年 的 发 展 , 高 质量 的 CPG 为 临床 医生 从 事 预 防 、 诊 断 、 治 疗 、 康 复 、 保 健 
和 管理 工作 带 来 许多 益处 , 已 成 为 国际 上 用 来 规范 医疗 行为 、 提 高 卫生 服务 质量 、 合 理 控制 医 
疗 费用 等 行 之 有 效 的 方法 。 本 章 将 介绍 临床 实践 指南 的 基本 概念 及 作用 , 查找 指南 的 主要 网 络 
资源 , 并 重点 讲述 临床 实践 指南 的 制作 方法 与 流程 , 以 及 如 何 科学 评价 CPG, 最 后 介绍 临床 实 
践 中 正确 应 用 CPG 的 原则 和 方法 。 


第 一 节 概 述 


一 、 临 床 实践 指南 的 概念 和 发 展 


临床 实践 指南 , 即 根据 特定 的 临床 情况 , 系统 制定 的 旨 在 帮助 医生 和 病人 做 出 恰当 处 理 的 
指导 意见 。“ 特 定 的 临床 情况 ”主要 指 的 是 常见 而 重大 的 临床 问题 , 如 “高 血压 的 防治 ”、“ 糖 尿 病 
防治 "“ 和 冠 心病 诊疗 "“ 脑 卒中 预防 " 等 ; “系统 制定 ” 即 依据 科学 的 方法 规范 化 地 制定 指南 的 过 
程 。CPG 的 产生 和 发 展 主要 与 下 列 三 个 因素 有 关 : 

(一 ) 临床 实践 的 巨大 差异 

自 20 世纪 80 年 代 以 来 , 人 们 很 快 就 注意 到 在 临床 实践 过 程 中 诊治 上 的 差异 现象 。 很 多 研 | 
究 均 发 现 对 于 相同 一 个 临床 问题 , 在 不 同 国家 或 同一 个 国家 的 不 同 地 区 甚至 在 同一 个 地 区 内 的 
不 同 医疗 机 构 之 间 其 处 理 方法 也 各 式 各 样 , 差异 性 极 大 。 例 如 一 项 关于 中 国 和 英国 对 急性 缺 血 
性 脑 卒中 治疗 方法 的 对 比 研究 ( 表 12-1), 发 现 19%~69% 的 中 国医 师 常 规 使 用 7 种 治疗 方法 , 而 
英国 医师 在 除 使 用 阿司匹林 外 的 其 余 6 种 疗法 上 的 使 用 比例 均 不 超过 1%。 在 美国 , 对 于 非 办 
膜 性 心房 颤动 患者 , 南部 与 中 西部 的 医生 使 用 华 法 林 预 防 脑 卒 中 的 比率 差异 达 4 倍 之 多 ; 在 同 
一 个 州 内 , 一 个 社区 的 儿童 扁桃 体 切除 率 是 8% , 而 另 一 个 社区 的 切除 率 则 高 达 70%。 临 床 实践 
的 巨大 差异 已 经 超过 了 临床 、 人 口 学 及 地 域 上 的 差异 所 能 解释 的 范围 , 令 人 们 对 这 些 差异 现象 
的 合理 性 及 使 用 这 些 治 疗 措施 的 科学 性 产生 怀疑 。 基 于 证 据 的 CPG 则 可 缩小 这 些 差 异 , 从 而 
规范 医疗 行为 , 使 患者 得 到 应 有 且 合 理 的 医疗 服务 。 

表 12-1 急性 缺 血性 脑 卒中 治疗 实践 的 中 英 对 比 























中 国医 师 英国 医师 中 国医 师 英国 医师 

治疗 方法 (%) (or 治疗 方法 (%) (%) 
十 油 / 甘 露 醇 69 1 低 分 子 右 旋 糖 醋 44 0 
中 药 66 0 蛇毒 30 0 
阿司匹林 54 39 激素 19 <1 
钙 持 抗 剂 53 | 








注 : 资料 来 自 Chen ZM ,et al. Hospital management of acute ischemic stroke in China. J Stroke Cerebrovasc Dis, 1997, 6: 
361-367.“ 回答 常规 使 用 各 种 治疗 方法 的 中 国医 师 的 百分比 ; + 回答 常规 使 用 各 种 治疗 方法 的 英国 医师 的 百分比 
(二 ) 医疗 措施 的 不 当 使 用 
有 研究 表明 在 日 常 临床 诊疗 实践 中 , 大 约 1/4 至 1/3 的 医疗 措施 使 用 不 当 , 存在 着 滥用 
(overuse)、 误 用 (misuse ) 或 使 用 不 足 (underuse) 等 问题 。 例 如 , 抗生素 对 病毒 所 致 的 普通 感冒 几 
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乎 没有 益处 , 抗生素 的 使 用 不 仅 增加 了 患者 的 经 济 负担 , 而 且 长 期 使 用 还 会 增加 副作用 和 导致 
耐 药 等 问题 。 而 美国 的 一 项 研究 却 显示 , 约 半数 的 普通 感冒 和 2/3 的 急性 支气管 炎 患 者 接受 了 
抗生素 治疗 , 此 为 混用。 腹泻 是 临床 常见 的 症状 , 在 发 病 初期 , 腹泻 能 将 肠 道内 的 致 病菌 或 其 
产生 的 毒素 等 有 害 物质 排出 , 对 于 细菌 感染 引起 的 这 类 腹泻, 止 海 治疗 不 仅 不 能 治愈 疾病 , 反 
而 会 增加 致 病菌 及 毒素 对 机 体 的 损害 , 但 大 多 数 患 者 常 自行 服用 蒙 脱 石 散 、 地 芬 诺 酯 等 止 泻药 
物 , 实 为 误 用 , 有害 无 益 。 中 国 缺 血性 脑 座 中 和 短暂 性 脑 缺 血 发 作 的 二 级 预防 指南 (2010 年 ) 明 
确 指 出 糖尿 病 患 者 且 合 并 高 血压 时 , 降 血 压 药 物 以 血管 紧张 素 转 换 酶 抑制 剂 、 血 管 紧张 素 I[ 受 
体 持 抗 剂 在 降低 心 脑 血管 事件 方面 获 益 明显 。 而 我 国 的 调查 研究 则 显示 , 这 类 药物 实际 的 服药 
率 不 到 50%, 此 为 使 用 不 足 。 
(三 ) 医疗 费用 的 日 益 增长 
目前 , 全 世界 面临 的 难题 是 有 限 的 医疗 资源 与 日 益 增长 的 医疗 保健 需求 之 间 的 矛盾 。2007 
年 我 国 卫生 总 费用 达 11 289.5 亿 元 ; 2008 年 为 14 535.4 亿 元 ; 而 2009 年 达到 17 541.9 亿 元 , 占 
GDP 百分比 为 5.15%。2010 年 医院 门诊 病人 和 住院 病人 的 人 均 医药 费用 , 按 当年 价格 比 2009 
年 分 别 上 涨 了 9.7% 和 9.0%。 即 使 如 美国 这 样 的 发 达 国家 , 庞大 的 医疗 补助 同样 也 让 政府 不 堪 
重负 。 因 此 , 明智 地 使 用 有 限 的 医疗 资源 已 经 成 为 国际 共识 。 根 据 科学 的 研究 证 据 如 成 本 - 效 
益 ( cost-benefit ) 分 析 、 成 本 -效果 (cost-effectiveness ) 分 析 、 成 本 - 效用 (cost-utility ) 分 析 、 成 本 最 
小 化 分 析 (cost minimization analysis ) 等 ， 制定 一 套 规范 化 诊疗 措施 或 临床 实践 指南 , 对 于 制定 医 
疗 费用 补偿 政策 .合理 高 效 地 使 用 有 限 的 医疗 资源 具有 重大 意义 。 ER 
自 20 世纪 80 年 代 以 来 ,诸如 上 述 问题 使 各 国政 府 和 医疗 保险 机 构 感到 了 不 堪 承 受 的 压力 ， 
因此 认为 CPG 或 许可 以 减少 不 恰当 的 医疗 行为 , 改善 患者 预后 , 提高 和 保障 医疗 服务 。CPG 的 
开发 与 应 用 自 此 被 提 上 工作 日 程 , 并 在 许多 国家 得 到 迅速 的 发 展 。 美国 、 加 拿 大 、 澳大利亚 .中 
加 香港 特别 行政 区 .新 加 坡 及 欧洲 诸 国 均 不 同 程度 地 建立 了 指南 开发 的 相关 机 构 , 发 展 了 诸多 
的 临床 指南 , 为 解决 卫生 保健 难题 作出 了 巨大 的 贡献 。 路 惰 的 是 我 国 的 临床 实践 指南 的 开发 还 
在 起 步 阶段 ,目前 尚 无 规范 统一 和 符合 人 循 证 医学 原则 的 指南 开发 专门 机 构 及 相关 程序 。 
二 、 临 床 实践 指南 的 作用 
一 个 好 的 循 证 CPG 需 具备 真实 性 、 可靠 性 、 可 重复 性 ,临床 实 ( 适 ) 用 性 和 明确 的 目 
特征 ,一 般 是 由 各 学 科 共同 参与 制作 的 .对 当前 最 佳 临 床 证 据 的 评价 与 集成 。 临 床 实践 指南 的 
作用 可 归纳 为 以 下 六 点 ; 四 提高 医疗 质量 、 改 善 临床 结局 ; @ 概 述 研究 发 现 的 结果 , 并 使 临床 次 
策 透 明 化 ; @ 减 少 不 同 医疗 机 构 和 不 同 医 师 间 医 疗 实践 中 的 不 恰当 差异 ; @ 促 进 卫 生 资 源 的 合 
理 高 效 利用 , 从 而 减少 患者 的 医疗 费用 ; @ 区 分 医学 研究 结果 的 优先 次 序 ,作为 医疗 保险 的 任 
证 ; @ 有 助 于 医务 人 员 的 终身 继续 教育 。 
2011 年 哈佛 大 学 研究 人 员 在 《医院 医学 杂志 XJournal of hospital Medicine ) 上 发 表 了 一 篇 
名 为 “Use of UpToDate and Outcomes in US Hospitals” 的 文献 。 它 对 比 了 1017 家 应 用 图 文 并 茂 的 
综合 性 循 证 指南 UpToDate 的 医院 和 2305 家 未 采用 UpToDate 的 医院 的 医疗 保险 受益 人 数据 , 同 
时 评估 了 这 些 医院 的 医疗 质量 和 效率 。 研 究 结果 表明 , 应 用 UpToDate 的 1017 家 医院 生年 机 
省 约 372 500 住院 日 ,在 三 年 考察 期 中 累计 挽救 了 约 11 500 例 患 者 生命 。 根 据 全 美 医院 质量 联 
盟 (Hospital Quality Alliance ) 所 制定 的 指标 来 评定 , 发 现 应 用 UpToDate 的 医院 提供 了 更 佳 的 服 
务 质量 。 研 究 提示 : 医生 使 用 UpToDate 系统 , 可 帮助 他 们 做 出 正确 的 即时 诊断 和 治疗 决策 ,可 
使 医院 患者 驻 留 时 间 缩短 .死亡 减少 上 医疗 服务 质量 得 到 提高 。 


三 、 指 南 与 临床 证 据 的 关系 
临床 证 据 指 的 是 循 证 医学 中 与 临床 实践 密切 相关 的 研究 结果 , 这 里 的 研究 主要 是 针对 人 体 
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的 ,包括 探讨 诊断 性 试验 准确 性 和 精确 性 的 证 据 、 评 估 临 床 诊治 安全 性 和 有 效 性 的 证 据 以 及 研 
究 疾 病 预后 和 预后 因素 的 结果 的 证 据 等 。 因 为 各 种 类 型 临床 证 据 的 来 源 、 科 学 性 和 可 靠 性 是 不 
同 的 , 所 以 其 论证 强度 也 是 不 一 样 的 。 

这 里 介绍 的 是 牛津 循 证 医学 中 心 (Oxford Centre for Evidence-based Medicine, OCEBM ) 的 临 
床 研究 证 据 分 级 , 亦 属于 新 5 级 的 证 据 分 级 法 ( 表 12-2)。 


表 12-2 牛津 循 证 医学 中 心 临床 研究 证 据 分 级 








推荐 等 级 证 据 分 级 要 求 
A la 同 质 性 的 RCT 的 系统 评价 
lb 可 信和 区 间 窜 的 单个 RCT 
le 观察 结果 “全 或 无 
B 2a 同 质 性 的 队列 研究 的 系统 评价 
2b 单个 队列 研究 , 包括 低 质量 的 RCT, 如 随访 率 <80% 
3a 同 质 性 病例 对 照 研究 的 系统 综述 
3b 单个 病例 对 照 研究 
C 水 病例 报告 、 低 质量 队列 研究 及 病例 对 照 研究 
D 5 缺乏 严格 评价 的 专家 意见 , 或 基于 病理 生理 和 基础 研究 证 据 





原始 研究 证 据 和 系统 评价 是 客观 地 提供 研究 结果 和 对 结果 的 解释 , 对 临床 实践 有 重要 的 
参考 和 指导 价值 。 循 证 医学 提倡 在 临床 实践 中 , 尽 可 能 使 用 当前 可 得 到 的 最 好 证 据 、 结 合 临床 
经 验 和 患者 的 意愿 进行 诊疗 方案 的 选择 。 加 拿 大 MeMaster 大 学 临床 流行 病 学 与 生物 统计 学 
Haynes 教授 提出 了 支持 循 证 卫生 决策 的 循 证 医学 证 据 结构 的 “6S"” 模型 。 

“6S" 模型 即将 原始 研究 (如 PubMed 数据 库 的 原始 研究 ) 作 为 最 底层 , 原始 研究 摘要 作为 第 二 
层 , 综述 ( 即 系统 评价 , 如 Cochrane 系统 评价 ) 作 为 第 三 层 , 然后 是 系统 评价 摘要 (如 循 证 期 刊 对 原 
始 研究 和 综述 的 简要 描述 ), 接 下 来 是 循 证 教科 书 中 综述 或 研究 总 结 、 临 床 实践 指南 (summaries )。 
最 后 是 系统 (systems), 系统 通常 是 整合 有 CPG 的 计算 机 决策 支持 系统 (CDSS), 可 根据 个 体 患 者 
的 特征 (如 电子 病历 ) 链 接 相 关 证 据 , 置 于 模型 的 最 顶层 。 系 统 可 提醒 或 告知 医护 人 员 治 疗 的 决 
策 。 遗 憾 的 是 目前 这 种 计算 机 决策 支持 系统 寥寥 无 几 , 目 未 能 做 到 及 时 更 新 。 但 可 以 预见 这 将 
是 CPG 网 络 资源 利用 研究 的 一 个 重要 发 展 方向 。 

“6S” 模型 充分 体现 了 临床 实践 指南 在 循 证 医学 证 据 体系 中 的 地 位 及 其 重要 的 临床 指导 意义 。 
同样 指南 也 是 循 证 医学 资源 的 一 部 分 , 它 与 原始 研究 证 据 和 系统 评价 的 区 别 在 于 : 指南 是 针对 
具体 临床 问题 , 分 析 评价 证 据 后 提出 具体 的 推荐 意见 , 是 连接 证 据 和 临床 实践 的 桥梁 和 纽带 。 


四 、 循 证 临床 实践 指南 的 网 络 资源 

21 世纪 的 循 证 医学 资源 增长 迅猛 , 临床 实践 指南 (CPG ) 作 为 循 证 医学 资源 的 特殊 成 员 , 其 
网 络 资源 也 日 益 增 多 。 尽 管 医学 界 对 临床 实践 指南 网 络 资源 的 开发 和 利用 现状 还 不 尽 如 人 意 ， 
但 循 证 医学 资源 的 有 效 利 用 和 开发 还 是 值得 期 待 的。 在 此 ,我 们 将 介绍 主要 的 临床 实践 指南 网 
络 资源 的 分 布 及 检索 方法 。 

(一 ) 原始 研究 证 据 数据 库 

美国 国家 图 书馆 开发 研制 的 PubMed 是 循 证 医学 原始 研究 证 据 数据 库 的 代表 , 也 是 查找 临 
床 实践 指南 的 重要 资源 。 它 收录 了 世界 各 国 制作 的 指南 , 可 使 用 “limit" 辅助 检索 功能 , 只 要 在 
“Type of article” 的 下 拉 菜 单 中 选中 “practice guideline” 即 可 检索 临床 实践 指南 。 

中 国 知识 基础 设施 数据 库 ( China National Knowledge Infrastructure, CNKI)( http://www.cnki.net ) 
含 1100 余 种 中 文 医药 卫生 类 型 期 刊 索引 、 引 文 索引 及 全 文 和 报刊 全 文 , 更 新 较 及 时 , 可 检索 中 
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华 医学 会 发 布 的 各 种 临床 实践 指南 。 
(二 ) 循 证 临床 指南 资源 库 
UpToDate( http://www.uptodate.com ) 创 建 于 1992 年 , 由 美国 Dr.Burton D.Rose 和 Dr.Joseph 

Rush 开发 , 隶属 于 Wolters Kluwer health 公司 , 该 公司 为 医疗 保健 行业 提供 信息 、 商 业 智能 和 即 

时 解决 方案 , 是 Wolters Kluwer 旗下 的 公司 。 而 Wolters Kluwer 则 是 一 家 全 球 领先 的 信息 服务 公 

司 。UpToDate 是 图 文 并 茂 的 综合 性 循 证 指南 、 患 者 手册 及 药物 间 交 互 作 用 查询 系统 , 给 医师 、 

药师 提供 即时 、 实 证 的 临床 医药 信息 , 并 可 以 快速 解答 临床 专业 人 员 提 出 的 临床 问题 。 文 献 中 

附 有 图 片 ,包括 图 表 、X 线 片 、 相 片 、 影 像 档 等 , 及 MEDLINE 的 引用 文献 摘要 。UpToDate 主题 包 

括 内 科学 、 妇 产科 学 等 二 十 个 类 别 , 每 个 主题 之 下 尚 有 更 专 精 的 类 别 , 其 内 容 系 由 网 罗 众 多 相 

关 的 文献 而 成 , 可 以 快速 地 获得 临床 上 最 前 沿 医学 问题 的 答案 。 

EBM Guideline( ebmg.wiley.com ) 由 芬兰 医学 协会 开发 和 维护 ,隶属 于 Wiley Blackwell 公司 ， 

该 公司 成 立 于 2007 年 ,是 世界 领先 的 学 协会 出 版 商 , 出 版 大 约 1350 种 同行 评审 学 





# 术 期 刊 及 涵 
盖 面 广泛 的 具有 全 球 影响 力 的 书籍 。 涵 盖 学 科 领 域 包括 科学 、 技 术 、 医 学 、 社 会 科学 及 人 文 , 为 
广大 科研 教学 人 员 提 供 最 新 的 高 质量 的 信息 。EBM Guidelines 包含 有 综合 性 循 证 指南 、 证 据 总 
结 、 医 学 图 片 .影音 , 收录 涵盖 实证 数据 的 基础 医疗 临床 指引 , 提供 最 新 的 临床 医学 发 展 及 实证 
资料 , 内 容 全 面 涵盖 了 全 科 医 师 经 常 遇 到 的 临床 问题 , 并 提供 诊断 结果 及 治疗 方法 (包括 相应 的 
推荐 意见 及 强度 )。 可 链接 至 高 质量 的 照片 影像 及 实证 文献 。 

(三 ) 临床 实践 指南 网 站 

世界 各 国都 有 相应 的 网 站 专门 提供 临床 实践 指南 检索 。 其 中 比较 大 型 且 权威 的 有 美国 国 
立 指 南 数据 库 和 加 拿 大 医学 会 临床 实践 指南 网 站 等 。 

1. 美国 国立 指南 数据 库 ( National Guideline Clearinghouse, NGC )( http://www.guideline.gov ) 由 
美国 卫生 健康 研究 与 质量 机 构 (AHRQ )、 美 国医 学 会 (AMA ) 和 美国 卫生 健康 计划 协会 (AAHP ) 
于 1998 年 联合 制作 。 它 是 一 个 提供 CPG 和 相关 证 据 的 且 功 能 完善 的 免费 数据 库 。NGC 提供 直 
接 检 索 和 浏览 两 条 检索 途径 , 并 可 对 收集 的 指南 进行 比较 。 

2. 加 拿 大 医学 会 临床 实践 指南 网 站 (Canadian Medical Association Clinical Practice Guidelines )， 
其 数据 库 ( http://www.cmaj.ca/misc/service/guidelines.html ) 由 加 拿 大 国家 、 州 或 地 区 医学 卫生 组 
织 、 专 业 协 会 .政府 机 构 和 专家 小 组 于 1995 年 共同 主办 。 指 南 由 加 拿 大 各 地 和 各 机 构 团 体 提 
供 。 网 站 的 栏目 有 : 开发 者 名 单 .最 新 内 容 .热门 话题 新闻、 方法 与 资源 、 其 他 CPG 网 站 、 常 见 
问题 解答 、 搜 索 帮 助 .用 户 反馈 及 提交 指南 说 明 等 。 网 站 上 还 链接 有 加 拿 大 医学 会 制作 的 《临床 
实践 指南 手册 》 网 站 中 一 半 以 上 的 指南 有 全 文 。 

3. 苏格兰 校 际 指南 协作 网 (Scottish Intercollegiate Guidelines Network, SIGN )( http://www.sign. 
ac.uk/guidelines ) 建 于 1993 年 ,为 苏格兰 国家 卫生 服务 开发 临床 实践 指南 。 重 点 关注 癌症 、 心 血 
管 疾病 和 心理 卫生 等 领域 。 网 站 的 栏目 有 : 指南 (分 为 按 主题 排列 的 指南 和 按 索取 号 排列 的 指 
南 )、 指 南 选 题 提示 或 范围 .当前 指南 项 目 组 正在 进行 的 工作 ,指南 开发 的 方法 学 等 。 此 外 ,该 
网 站 还 链接 有 指南 制作 的 支持 材料 .简介 .用 户 申明 及 版 权 细 节 等 内 容 。 网 站 提供 指南 全 文 。 

4. 新 西 兰 指南 研究 组 (The New Zealand Guideline Group, NZGG )(http://www.nzgg.org.nz ) 由 
新 西 兰 卫生 部 在 1996 年 组 建 , 主要 目的 是 为 了 制定 和 实施 循 证 临床 实践 指南 。 内 容 主要 包括 ， 
用 于 实践 的 证 据 、 消 费 者 资源 ,新西兰 循 证 健康 公告 等 。 其 将 指南 分 为 四 种 类 型 ; 基层 医疗 服 
务 管理 指南 ( guidelines for primary care management)、 病 人 和 转 诊 和 管理 指南 ( guidelines for patient 
referral and managemeni)、 第 一 专科 评估 准 入 标准 指南 (guideline for access criteria for first special 




























































jist assessment ) 和 临床 优 先 评估 标准 指南 (guideline for criteria for clinical priority assessment )。 此 
外 .该 网 站 还 链接 一 系列 与 临床 指南 的 开发 和 评价 有 关 的 网 站 , 如 : 证 据 源 、Cochrane 协作 组 、 
循 证 方法 及 根据 、 临 床 指南 等 网 站 。 
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(四 ) 循 证 医学 期 刊 

ACP Journal Club( http://www.acpjc.org/ ) 由 美国 内 科 医 师 协会 于 1991 年 创办 。 网 上 可 免费 获 
取 全 文 。 在 ACP Journal Club 网 站 上 搜索 有 关 专 题 的 临床 实践 指南 , 只 需 在 检索 框 中 输入 某 个 
专题 , 在 检索 框 下 的 “article type” 中 选择 “clinical prediction guide” 即 可 。 

(五 ) 循 证 医学 多 元 搜索 引擎 

1. SumSearch( http://sumsearch.uthscsa.edu ) 由 美国 Texas 大 学 的 卫生 科学 中 心 建 立 并 维护 ， 
同步 检索 Cochrane 图 书馆 、 免 费 PubMed NGC 等 。 最 大 优点 是 能 帮助 临床 医师 快速 获得 所 需 
证 据 , 对 临床 实践 很 有 帮助 。 可 同时 检索 系统 评价 和 临床 实践 指南 , 可 针对 治疗 、 诊 断 、 病 因 、 
预后 等 方面 进行 限定 检索 。 

2. TRIP Database( http://www.tripdatabase.com )1997 年 建立 , 可 同步 检索 数 十 种 证 据 源 ， 包括 
循 证 摘要 、 循 证 指南 、 二 次 研究 .患者 手册 等 。 该 数据 库 提 供 分 类 浏览 和 关键 词 检索 两 种 检索 
途径 。 其 Clinical Areas 下 列 有 13 个 分 类 专题 目录 , 如 Cancer、cardiovascular 等 。 用 户 可 以 选择 
点 击 浏览 相关 内 容 。 关 键 词 检 索 分 为 简单 检索 和 高 级 检索 两 种 方式 , 检索 方便 , 结果 层次 清晰 。 

3. Doctor Desk(http:/drsdesk.sghms.ac.uk ) 由 英国 国家 保健 服务 (系统 ) 卫 生 保 健 电 子 图 书馆 
(NeLH ) 建 立 , 网 站 立足 于 简单 易 用 , 主页 上 有 EBM Search 检索 框 , 输入 检索 词 即 开始 检索 循 证 
医学 方面 的 指南 、 系 统 评价 或 研究 论文 。 指 南 来 自 SIGN、NICE、PRODIGY 和 NeLH。 检 索 功能 
较为 完善 , 检索 词 之 间 可 以 用 "AND”“0R"”、NOT" 逻辑 运算 符 。 
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一 、 临 床 实践 指南 的 制定 方法 


一 般 分 为 两 类 : 

(一 ) 专家 共识 制定 法 (consensus guideline development) 

分 为 非 正式 和 正式 的 专家 共识 制定 法 。 非 正式 的 专家 共识 制定 法 是 由 一 组 专家 开会 讨论 ， 
将 一 次 或 多 次 开会 讨论 后 达成 的 共识 形成 推荐 意见 .再 由 专业 学 会 或 政府 机 构 进 行 发 布 。 这 种 
共识 只 包括 推荐 意见 而 缺乏 形成 推荐 意见 的 证 据 基础 和 制定 共识 的 背景 及 方法 , 易 受 参 会 人 员 
的 专业 、 优 势 、 性格、 组 织 和 政治 因素 等 影响 , 可 靠 性 和 质量 较 差 。 

正式 的 专家 共识 制定 法 , 首先 是 应 邀 专家 召开 预备 会 , 就 某 一 治疗 措施 专家 组 提供 相关 研 
究 证 据 的 综述 并 形成 可 能 的 适应 证 清单 。 然 后 在 第 一 次 正式 会 议 时 专家 组 成 员 对 每 个 适应 证 
进行 评分 以 评价 其 适用 性 , 评分 通常 使 用 手 填 量 表 的 方式 , 量 表 分 为 1 分 到 9 分 , 1 分 为 完全 不 
适用 ,9 分 为 特别 适用 , 5 分 为 可 用 或 不 用 。 再 次 开会 时 专家 们 将 小 组 集体 评分 的 情况 与 自己 的 
评分 相 比较 , 讨论 不 一 致 的 原因 , 然后 再 次 重复 评分 , 在 会 议 讨 论 的 基础 上 修改 评分 。 最 后 的 
评分 反映 了 专家 组 成 员 的 一 致 性 程度 。 这 种 制定 法 虽然 考虑 了 研究 证 据 , 但 仍然 没有 将 推荐 意 
见 与 相关 证 据 的 质量 明确 联系 在 一 起 , 在 实践 中 临床 医生 难以 恰当 选用 。 

(二 ) 特殊 指南 制定 法 

分 为 明晰 指南 制定 法 ( explicit guideline development ) 和 循 证 实践 指 南 制定 法 (evidence-based 
guideline development )。 

明晰 指南 制定 法 是 由 指南 制定 者 对 治疗 措施 的 益处 、 危 害 及 费用 作出 说 明 , 并 明确 地 估计 
出 现 每 种 结局 的 概率 。 估 计 值 的 来 源 也 一 定 会 在 文件 中 具体 写 明 。 因 为 这 种 分 析 方法 非常 复 
杂 , 对 指南 制定 者 来 说 太 烦 琐 , 目前 使 用 此 方法 已 不 多 , 在 实践 应 用 中 也 不 适用 。 

循 证 实践 指南 制定 法 (evidence-based guideline development), 是 目 前 国际 推崇 的 指南 制定 方 
法 , 即将 推荐 意见 与 证 据 质量 明确 地 联系 在 一 起 , 依据 现 有 证 据 来 确定 推荐 意见 的 强度 。 这 也 
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是 循 证 临床 指南 的 明显 特征 , 是 保证 指南 的 科学 、 公 正和 权威 的 方法 。 以 下 将 重点 介绍 此 方法 
的 制定 流程。 


二 、 循 证 实践 临床 指南 制定 流程 及 步 又 


苏格兰 校 际 指南 协作 网 (Scottish Intercollegiate Guidelines Network, SIGN ) 是 目前 推荐 的 循 证 
实践 指南 制定 的 代表 机 构 。 


























制定 流程 为 : 由 指南 开发 组 织 确定 指南 题目 和 意义 一 成立 指南 制定 小 组 一 一 检索 并 系统 
评价 文献 (证 据 ) 一 形成 指南 推荐 草案 一 咨询 并 进行 同行 评审 一 一 发 布 指南 一 一 临床 应 用 
指南 一 再 评估 。 其 制定 指南 的 主要 步 驰 如 下 ， 


(一 ) 确定 指南 目的 和 意义 

指南 开发 组 织 机 构 首先 确定 指南 拟 解决 问题 的 重要 性 (如 发 病 率 、 结 局 效果 、 经 济 费 用 ) 及 
制定 指南 的 必要 性 、 目 的 和 使 用 范围 。 

(二 ) 成 立 指南 制定 小 组 

指南 制定 小 组 人 员 一 般 要 求 来 自 不 同 地 区 的 多 个 学 科 , 一 般 为 15~20 人 , 包括: 医生 , 专业 
编辑 人 员 , 信息 专家 ,IT 专业 人 士 及 市 场 和 培训 人 员 。 并 确定 制定 指南 的 规范 程序 。 指 南 制定 
人 员 的 素质 应 具备 四 个 核心 技能 : 临床 专业 技能 ; 卫生 保健 的 实践 经 验 ; 专业 知识 技能 ; 严格 的 
评估 技能 。 

(三 ) 检索 文献 (证 据 ) 

全 面 收集 世界 范围 内 的 相关 研究 资料 。 一 般 是 先 检索 已 有 的 临床 指南 , 再 检索 最 新 的 系统 
评价 证 据 , 最 后 是 原始 研究 证 据 。 信 息 专家 负责 审查 检索 结果 的 质量 , 经 审查 合格 的 文献 再 送 
交 制 定 指南 的 专家 小 组 。 

(四 ) 评价 文献 (证 据 ) 

指南 制定 专家 对 证 据 提出 推荐 意见 并 对 推荐 强度 进行 标注 。 指 南 制定 小 组 首先 制定 一 套 
明确 的 文献 纳入 和 排除 标准 , 然后 对 最 终 纳入 的 文献 , 采用 一 套 严 格 的 文献 评价 系统 来 评价 文 
献 的 质量 , 同时 对 文献 进行 证 据 分 级 。 

首先 , 对 证 据 内 涵 和 质量 的 评价 , 一 般 包 括 如 下 方面 : @ 证 据 的 一 致 性 : 包括 各 个 文献 的 
总 体 一 致 性 ; 各 文献 人 选 人 群 特征 (如 年 龄 ,性别 、 宗 教 信 爷 等 ) 的 一 致 性 ; 研究 内 容 的 一 致 性 。 
加 外 部 真实 性 : 研究 结果 是 否 与 实际 应 用 时 的 结果 一 致 或 者 相反 。@ 针 对 性 : 证 据 是 否 直 接 针 
对 指南 的 目标 人 群 。@ 证 据 容量 : 即 每 个 研究 人 群 的 样本 数量 和 所 有 相关 研究 的 样本 数量 。 

其 次 , 对 证 据 的 解释 , 一 般 包括 如 下 方面 : 病人 意愿 : 权衡 指南 应 用 后 的 利弊 ; 对 患者 预 
后 的 改善 程度 。 名 临床 实 际 : 证 据 是 否 与 当地 现 有 的 医疗 实际 情况 有 极 大 的 差距 。G@) 资 源 分 
配 : 证据 是 否 会 导致 大 规模 的 资源 重新 分 配 。 

在 文献 评价 中 , 每 一 篇 文献 至 少 应 有 2 名 指南 制定 小 组 成 员 进 行 评价 , 如 果 评 价 存在 分 歧 ， 
则 由 第 三 者 仲裁 解决 。 最 后 , 经 过 严格 的 证 据 评价 达成 共识 , 并 且 根 据 支持 证 据 的 强度 决定 推 
荐 的 等 级 , 从 而 制定 出 指南 初稿 。 

(五 ) 形成 并 评审 指南 草案 

指南 草案 形成 后 , 将 提交 给 指南 制定 小 组 外 的 同行 专家 团 进行 评审 。 这 个 评审 专家 团 将 对 
指南 初稿 做 出 评价 并 对 初稿 中 存在 的 问题 向 指南 小 组 提出 疑问 及 建议 。 指 南 制 定 小 组 根据 建 
议 进一步 修订 指南 。 修 订 版 再 次 送 同行 专家 团 进行 评价 。 最 后 , 由 SIGN 编辑 组 对 指南 进行 审 
查 并 做 出 最 终 评价 。 

(六 ) 发 布 指南 及 评估 

当 指 南 正 式 成 文 后 , 可 制 成 各 种 版 本 发 布 , 供 不 同 的 对 象 使 用 。 除 了 全 文 外 , 可 以 是 摘要 
性 的 结论 性 建议 , 也 可 以 是 针对 患者 的 教育 手册 。 当 指南 发 布 后 , 制定 专家 小 组 将 负责 推广 和 
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指导 指南 的 使 用 , 同时 监督 和 评价 指南 的 执行 情况 , 收集 反馈 信息 。 

(七 ) 指南 更 新 

每 个 指南 发 布 2 年 后 需要 进行 再 评估 。 将 根据 该 领域 的 最 新 进展 以 及 后 效 评估 的 反馈 意 
见 ,决定 是 否 更 新 指南 。 

指南 的 制定 是 一 个 十 分 复杂 的 过 程 。 在 这 个 过 程 中 , 还 需要 考虑 患者 和 护理 者 的 参与 ,并 
收集 他 们 的 建议 , 以 确保 他 们 的 意愿 在 指南 中 得 到 体现 。 由 于 制定 每 一 个 指南 需 耗费 大 量 的 金 
钱 和 时 间 , 指南 文件 形成 后 应 注意 保存 指南 制定 过 程 中 形成 的 文件 , 以 便 后 期 指导 或 评估 时 使 
用 。 例 如 : 制定 指南 的 原始 提议 、 制 定 指南 的 缘由 、 指 南 制定 中 的 关键 问题 及 检索 策略 和 数据 
库 、 文 献 的 纳入 及 排除 标准 、 回 答 所 有 关键 问题 的 证 据 总 结 表 、 指 南小 组 对 证 据 质量 和 相关 建 
议 分 级 、 会 议 总 结 及 同行 评议 和 回复 记录 。 

其 中 , 循 证 实践 临床 指南 具有 科学 客观 的 证 据 依据 , 令 人 信服 ; 同时 又 标注 了 推荐 意见 的 
强度 , 便于 使 用 者 根据 其 强度 是 否 采用 其 推荐 意见 。 虽 然 制 定 临床 实践 指南 要 求 使 用 系统 评价 
的 证 据 作 为 基础 , 但 当 一 些 常见 和 重要 的 临床 问题 还 缺乏 充分 的 A 级 证 据 时 , 指南 可 以 基于 稍 
差 的 证 据 , 但 必须 取得 小 组 成 员 的 共识 。 这 样 的 指南 既 贴 近 现实 , 又 可 被 接受 。 

总 而 言 之 , 一 个 好 的 指南 应 具备 两 个 特点 : 一 是 对 证 据 进行 综合 及 概括 , 得 到 某 种 干预 措 
施 对 典型 患者 的 平均 效果 证 据 。 二 是 说 明 如 何 将 这 一 证 据 用 于 形成 推荐 意见 。 针 对 推荐 意见 
需要 具体 说 明 干预 措施 的 利 整 、 局 限 性 、 最 适宜 的 患者 及 人 群 , 以 及 与 成 本 和 卫生 保健 有 关 的 
其 他 因素 。 
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对 同一 种 疾病 , 不 同 的 国家 或 学 术 组 织 可 能 制定 出 不 同 的 指南 , 指南 的 质量 也 可 参差 不 齐 ， 
甚至 某 些 建议 互相 矛盾 , 这 些 都 将 给 临床 决策 带 来 极 大 困扰 。 因 此 , 在 使 用 指南 之 前 , 临床 医 
生 应 有 评价 和 鉴别 其 质量 高 低 的 能 力 , 判断 该 指南 是 否 值得 推荐 使 用 , 或 者 从 众多 的 指南 中 挑 
选 出 质量 最 好 的 应 用 于 临床 实践 。 以 我 国 2011 年 “ 循 证 医学 与 临床 实践 指南 制定 ,评价 和 解读 
方法 学 研讨 会 "上 的 数据 为 例 , 我 国 2010 年 共有 指南 75 篇 , 经 质量 评价 后 , 发 现 完全 符合 评审 
标准 的 只 有 2 篇 、 基 本 规范 的 有 7 篇 、 无 法 评价 的 有 66 篇 。 

一 、 临 床 实践 指南 的 评价 

首先 , 评价 一 个 临床 实践 指南 (CPG ) 的 好 坏 , 应 强调 以 证 据 为 基础 , 即 真实 性 。 好 指南 必 
须 使 用 循 证 医学 的 原则 和 方法 , 根据 证 据 的 可 信 程度 对 每 一 条 建议 进行 分 级 。 世 界 著名 临床 流 
行 病 学 家 、 循 证 医学 的 奠基 人 之 一 David Sackett 指出 ， 确定 指南 的 质量 好 坏 主要 依据 两 个 方面 : 
QD 指南 是 否 收集 了 所 有 最 新 (12 个 月 ) 的 有 关 证 据 , 并 对 其 进行 了 分 析 评 价 ,是否 对 其 真实 性 进 
行 了 分 级 ?加 指南 是 否 对 每 一 条 推荐 建议 标注 了 其 依据 的 证 据 级 别 和 相关 文献 出 处 ? 因此 ,对 
指南 的 质量 评价 实际 上 主要 集中 在 证 据 的 收集 、 评 价 和 合成 , 以 及 如 何 将 推荐 意见 与 相关 证 据 
进行 集成 的 过 程 。 

其 次 , 当 指 南 的 质量 真实 性 得 到 肯定 后 , 就 应 对 其 重要 性 进行 评价 。 即 该 指南 是 否 回答 了 
临床 需要 解决 的 重要 问题 ?这 些 问题 必须 是 临床 医生 在 工作 中 面 对 的 问题 。 当 然 , 由 于 临床 所 
面临 的 问题 相当 复杂 ,一 个 指南 不 可 能 陡 括 所 有 的 临床 问题 , 只 能 是 绝 大 多 数 重要 问题 。 

最 后 , 应 用 指南 前 还 要 评估 其 适用 性 。 一 个 指南 的 成 功 实施 依赖 于 四 个 因素 (4B): 

1. 疾病 负担 (burden of disease) 如 该 病 在 本 地 区 的 发 病 率 很 低 带 来 的 疾病 负担 低 , 因而 无 
需 使 用 参考 指南 ?我 的 病人 是 否 不 可 能 出 现 指南 中 所 描述 的 结果 ?如 果 是 这 样 , 则 应 用 指南 不 
仅 浪 费时 间 金 钱 , 还 可 能 造成 不 必要 的 伤害 。 反 之 , 则 应 积极 使 用 指南 。 具 体 到 个 体 病 人 时 ， 
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还 应 综合 考虑 : @ 我 的 病人 与 研究 证 据 中 的 病人 的 情况 差别 大 吗 ?@@ 在 现 有 的 环境 条 件 下 这 种 
治疗 方案 可 以 实施 吗 ?@ 指 南 中 推荐 的 治疗 方案 有 哪些 潜在 的 利 次 ? 

2. 患者 对 治疗 价值 的 看 法 (beliefs ), 对 治疗 方案 的 利弊 评价 是 否 有 别 于 指南 中 推荐 的 内 容 ? 

3. 执行 该 指南 所 推荐 的 措施 所 需 成 本 (bargain ) 有 多 大 , 机 会 成 本 如 何 ? 其 他 干预 措施 能 
否 有 更 大 的 获 益 ? 

4. 对 患者 实施 该 指南 是 否 存在 不 可 克服 的 障碍 (barriers)? 这 些 困 难 包括 地 域 性 的 (如 该 地 
区 根本 不 能 实施 此 治疗 方法 )、 传 统 性 的 (如 长 期 惯用 另 一 种 治疗 方法 入 权威 性 的 (教授 怎么 说 
就 得 怎么 做 )、 法 律 性 的 (医生 惯 怕 因 为 舍弃 了 常用 但 效果 不 明显 的 疗法 会 遵 到 起 诉 )、 行 为 性 的 
(医生 无 能 为 力 或 病人 不 能 服药 )。 若 这 些 障碍 明显 , 则 无 法 实施 指南 。 

总 之 , 指南 的 推荐 意见 是 原则 性 的 , 应 在 一 般 原则 指导 下 , 实施 个 体 化 诊治 , 同时 还 应 结合 
患者 (或 其 家 属 ) 的 需求 及 价值 取向 。 

二 、 临 床 实践 指南 的 评价 工具 

许多 国家 和 学 术 团体 都 制定 了 CPG 的 评价 工具 以 便 科 学 客观 地 评价 CPG。 目 前 , 得 到 公 
认 的 指南 评价 工具 有 两 个 : 美国 COGS(the conference on guideline standardization ) 评 价 标准 和 欧 
洲 AGREE( appraisal of guidelines research and evaluation ) 量 表 。 

(一 ) 美国 COGS 评价 标准 

美国 医学 研究 所 (Institute of Medicine, IOM ) 早 在 1990 年 发 表 了 第 一 个 针对 CPG 的 评价 工 
具 , 共 8 条 评价 标准 , 分别 是 效 度 、 信 度 、 临 床 实用 性 、 临 床 灵活 性 、 透 明度 、 多 学 科 联 合 开发 、 
指南 定期 评价 、 指 南开 发 。2002 年 美国 COGS 会 议 确定 了 18 条 评价 指南 的 标准 。 表 12-3 总 结 
了 美国 COGS 会 议 制定 的 18 条 评价 标准 。 

















表 12-3 ”GCP 报告 的 COGS 清单 











条 目 描述 
1. 概述 提供 结构 性 摘要 包括 发 布 日 期 ,指南 情况 (原版 修订、 更 新 )、 印 刷 和 电子 版 
2. 重点 描述 指南 涉及 的 主要 疾病 和 干预 措施 , 指出 可 替代 的 预防 .诊断 和 干预 措施 
3. 目标 指南 希望 达到 的 目标 , 和 达到 这 一 目标 的 理由 
4. 使 用 者 /背景 描述 指南 的 使 用 者 和 指南 应 用 的 背景 
5. 目标 人 群 适合 指南 推荐 的 患者 人 群 并 列 出 排除 标准 
6. 制定 者 区 别 指南 制定 机 构 与 指南 制定 个 人 的 潜在 利益 冲突 
7. 资金 来 源 或 赞助 人 ”确定 资金 来 源 或 赞助 人 在 指南 制定 和 发 布 中 的 作用 , 说 明 潜在 的 利益 冲突 
8. 收集 证 据 的 方法 。 “描述 文献 的 检索 方法 ,包括 日 期 .数据库 和 检索 标准 
9. 建议 分 级 标准 描述 证 据 质 量 的 分 级 标准 和 推荐 强度 的 分 级 系统 。 推 荐 强度 与 推荐 的 重要 性 


相关 , 并 基于 证 据 的 质量 和 预期 获 益 或 损害 的 大 小 
10. 综合 证 据 的 方法 。 描述 证 据 如 何 被 综合 为 推荐 意见 , 如 证 据 表格 、meta 分析 、 决 策 分 析 


11. 发 布 前 评审 描述 指南 发 布 前 是 如 何 进行 评审 的 
12. 更 新 计划 陈述 是 否 有 指南 更 新 计划 , 并 标注 本 指南 的 有 效 其 
13; 定义 描述 不 常用 的 术语 , 并 严格 纠正 易 被 指南 误解 之 处 


14. 建议 与 基本 原则 准确 地 陈述 指南 的 作用 和 执行 指南 的 特殊 情况 , 通过 描述 证 据 与 推荐 之 间 的 
联系 来 判断 每 一 项 推荐 , 根据 第 九条 来 显示 证 据 的 质量 和 推荐 的 强度 





15. 潜在 利弊 应 用 指南 预期 的 获 益 和 潜在 的 风险 
16. 患者 意愿 当 指 南 涉及 个 人 选择 或 价值 时 应 考虑 患者 的 意愿 
17. 法 则 必要 时 提供 图 表 说 明 


18. 指南 在 执行 中 需要 ”描述 指南 推荐 应 用 时 的 障碍 , 对 任何 辅助 文件 给 予 参考 文献 以 便于 应 用 
考虑 的 事项 
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(二 ) 欧洲 AGREE 量 表 
指南 研究 与 评价 工具 AGREE(appraisal of guidelines research and evaluation ) 由 13 个 欧洲 国 
家 的 研究 者 制定 。 该 评价 工具 在 国际 上 具有 较 高 的 权威 性 , 为 目前 国际 指南 质量 评价 的 基础 工 
具 。 可 从 http://www.agreecollaboration.org 下 载 获 得 。 
AGREE 量 表 包 括 6 个 维度 (指南 的 范围 和 目的 、 利 益 相 关 者 的 参与 度 .指南 开发 的 严格 性 、 
指南 的 清晰 性 与 明确 性 、 指 南 的 适用 性 和 编辑 工作 的 独立 性 ) 共 计 23 个 条 目 ( 表 12-4。 
表 12-4 AGREE 评价 工具 
维度 一 : 指南 的 范围 和 目的 (涉及 指南 的 总 目的 、 具 体 的 临床 问题 和 适用 的 患者 ) 
1. 明确 说 明 指 南 的 撰写 目的 
2. 明确 阐述 了 指南 所 涵盖 的 临床 问题 
3. 明确 阐述 了 指南 所 要 应 用 的 目标 人 群 , 应 提供 年 龄 范围 、 性别、 临床 类 型 及 共 病 
维度 二 : 利益 相关 者 的 参与 度 
4. 指南 制定 小 组 的 成 员 包 括 所 有 相关 方面 的 专家 
5. 指南 考虑 了 目标 患者 的 观点 和 选择 
6. 指南 的 适用 对 象 已 经 清楚 说 明 
7. 指南 发 表 前 已 经 在 日 标 使 用 者 中 进行 了 试行 
维度 三 : 指南 开发 的 严格 性 (涉及 收集 和 综合 证 据 的 过 程 , 制定 和 更 新 推荐 建议 的 步骤 方法 ) 
8. 采用 严格 系统 的 方法 检索 证 据 , 应 提供 检索 证 据 的 详细 策略 , 包括 使 用 的 检索 词 、 信 息 来 源 和 文献 
涵盖 的 时 间 
9. 证 据 的 纳入 和 排除 标准 有 清楚 的 描述 
10. 详细 描述 了 形成 推荐 建议 的 方法 
11. 形成 推荐 建议 时 充分 考虑 了 干预 措施 的 获 益 、 风 险 和 副作用 
12. 推荐 建议 与 支持 证 据 之 间 有 明确 的 联系 
13. 指南 发 表 前 接受 了 制定 小 组 以 外 专家 的 同行 评议 
14. 提供 了 更 新 指南 的 程序 
维度 四 : 指南 的 清晰 性 与 明确 性 
15. 推荐 建议 明确 而 不 含糊 
16. 针对 不 同 临床 状况 提供 了 不 同 的 治疗 选择 
17. 关键 的 推荐 建议 能 容易 识别 
18. 提供 了 指南 方便 应 用 的 工具 (如 概要 、 教 育 工具 、 针 对 患者 的 宣传 单 等 ) 
维 庶 五 : 指南 的 适用 性 (指南 应 用 时 可 能 涉及 的 单位 、 操 作 和 费用 问题 ) 
19. 讨论 了 应 用 该 指南 的 过 程 中 可 能 遇 到 的 困难 
20. 讨论 了 应 用 该 指南 的 过 程 中 可 能 的 费用 
21. 提供 监督 和 审查 指南 执行 情况 的 评价 标准 
维度 六 : 编辑 工作 的 独立 性 (推荐 建议 的 独立 性 和 对 指南 制定 组 各 成 员 利益 冲突 的 说 明 ) 
22. 指南 编辑 工作 独立 于 其 他 经 济 实体 , 不 受 基金 资助 机 构 的 影响 
23. 指南 制定 小 组 成 员 的 利益 冲突 或 竞争 性 利益 的 声明 


表 中 每 个 条 目 可 按 1~4 分 打分 , 完全 符合 条 目 要 求 的 打 4 分 , 完全 不 符合 的 打 1 分 , 介 于 二 
者 之 间 的 根据 测评 人 员 的 判断 给 2 分 或 3 分 。 在 评价 中 , 为 了 避免 审查 者 主观 性 影响 , 建议 由 
2~4 名 参评 人 员 来 评定 , 以 增加 指南 评估 的 可 靠 性 。 同 时 在 每 项 条 目 后 都 提供 了 补充 说 明 的 
信息 , 有 助 于 参评 人 员 对 条 目 所 涉及 问题 和 概念 有 更 好 的 理解 , 评分 正确 合理 。 最 终结 果 将 根 
据 公式 ( 表 12-5 ) 对 所 有 参评 人 员 的 评分 进行 综合 , 分 别 得 到 6 个 维度 中 每 一 个 部 分 的 标 化 百 
分 比 


2» 








笔记 及 





第 十 二 章 “临床 实践 指南 的 制定 与 评价 


表 12-5 第 一 维度 得 分 的 计算 方法 











条 目 1 条 目 2 条 目 3 总 区 
评估 员 1 2 3 3 8 
评估 员 2 3 3 4 10 
评估 员 3 2 4 3 9 
评估 员 4 2 3 二 9 
总 分 9 13 14 36 





可 能 的 景 高 分 数 一 4( 完 全 符合 )x 六 项 目 )x4( 评 估 员 )=48 分 

可 能 的 最 低 分 数 =1( 完 全 不 符合 )x3( 项 目 )x4( 评 估 员 )=12 分 

该 维度 的 标 化 百分比 =( 实际 总 分 一 可 能 最 低 分 数 )/( 可 能 最 高 分 数 一 可 能 最 低 分 数 ) 
=(36-12)/(48—12)=67% 


根据 6 个 维度 标 化 百分比 的 比值 大 小 判断 该 指南 是 否 值得 推荐 应 用 , 结果 分 3 个 等 级 : D 强 
烈 推 荐 : 大 多 数 条 目 为 高 分 (3~4 分 ), 并 且 6 个 维度 中 大 多 数 标 化 百分比 > 60%; @ 推 荐 : 低 分 条 
目 (1~2 分 ) 与 高 分 条 目 (3~4 分 ) 数 目 大 致 相当 , 6 个 维度 中 大 多 数 的 标 化 百分比 介 于 30%~60%; 
图 不 推荐 : 大 多 数 条 目 为 低 分 (1~2 分 ), 6 个 维度 中 大 多 数 的 标 化 百分比 <30%。 应 注意 6 个 维 
度 的 得 分 是 独立 的 , 不 宜 合并 成 一个 质量 评价 的 总 分 值 。 

AGREE 量 表 的 不 足 在 于 缺乏 具体 标准 来 评价 指南 的 临床 内 容 , 缺乏 对 推荐 意见 合理 性 的 
审查 , 因此 还 需要 专家 评议 和 临床 试用 来 补充 评估 。 尽 管 如 此 , AGREE 量 表 仍 是 评价 CPG 的 
首选 工具 。AGREEI[ 为 最 新 版 本 。 
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一 、 临 床 实践 指南 的 应 用 原则 

临床 实践 指南 是 为 临床 医生 处 理 临 床 问题 制定 的 参考 性 文件 , 是 推荐 应 用 而 非 强制 执行 ， 
应 避免 不 分 具体 情况 讶 目地、 教条 地 照搬 使 用 。 应 用 时 注意 考虑 以 下 原则 : 

(一 ) 个 体 化 原则 

在 应 用 指南 时 , 医生 应 充分 考虑 该 患者 临床 特征 是 否 与 指南 中 目标 人 群 一 致 。 面 对 具体 的 
个 体 患 者 ,临床 医生 应 该 在 指南 的 指导 下 ,综合 具体 病情 和 多 方面 的 因素 个 体 化 地 选择 治疗 方 
案 。 临床 谋生 应 具备 以 下 两 方面 素质 才能 保证 指南 的 正确 使 用 : 第 一 , 快速 判断 患者 病情 状况 
和 建立 诊断 的 能 力 ; 第 二 , 具有 对 患者 接受 干预 措施 可 能 获得 的 利弊 进行 评估 的 能 力 。 例 如 冠 
心病 合并 糖尿 病 患者 根据 指南 应 强烈 推荐 使 用 阿司匹林 , 但 如 患者 患 有 严重 的 消化 道 溃 疡 病 ， 
阿司匹林 需 慎 用 甚至 不 用 。 

(二 ) 适用 性 原则 

自己 患者 的 情况 与 指南 的 目标 人 群 相似 吗 ?” 如 果 相 似 , 可 以 考虑 应 用 指南 推荐 的 干预 措 
施 : 并 结合 本 地 区 或 医院 目前 的 医疗 条 件 , 患者 的 经 济 状况 ,评估 其 对 医疗 费用 的 承受 能 力 ， 
以 及 当地 医疗 保健 系统 的 覆盖 支持 能 力 等 因素 , 评估 该 干预 措施 的 可 行 性 和 费用 - 效益 比 。 例 
如 各 国 指南 都 推荐 急性 心肌 梗死 早期 (3~12 小 时 内 ) 行 经 皮 冠 状 动脉 介入 (PC1) 治 疗 , 但 在 我 国 
绝 大 多 数 基 层 医院 无 条 件 开展 此 项 技术 , 多 数 心肌 梗死 患者 也 不 能 承受 高 昂 费用 , 此 时 的 诊治 
就 只 能 先 采取 指南 建议 的 药物 治疗 方案 , 待 病情 适宜 条 件 下 转 上 级 医院 治疗 。 
(三 ) 患者 价值 取向 原则 
患者 或 其 亲属 的 价值 取向 和 意愿 在 临床 决策 中 具有 重要 的 作用 。 医 生 应 事先 与 患者 或 家 
属 沟通 , 了 解 他 们 期 望 的 结局 指标 以 及 与 指南 中 的 结局 指标 是 否 一 致 , 差距 有 多 大 。 应 充分 尊 
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重 患 者 或 家 属 的 选择 。 例 如 对 1 例 晚期 肺癌 患者 , 应 用 体力 状况 (performance statue, PS ) 评 分 标 
准 进行 评估 , 得 到 评分 为 3 分 (PS 评分 一 般 要 求 不 大 于 2 分 才 可 能 实施 有 效 的 抗 肿 瘤 治疗 ), 子 
这 种 情况 下 指南 不 支持 使 用 细胞 毒 类 药物 , 因为 放 化 疗 与 妨 息 治疗 对 生存 期 没有 改 
重 副作用 会 影响 患者 的 生存 质量 。 但 患者 及 家 属 坚持 认为 不 积极 治疗 就 等 于 放弃 , 最 后 还 
重 患者 及 家 属 的 意愿 , 试行 放 化 疗 , 并 予以 严密 监测 患者 病情 变化 - 

(四 ) 时 效 性 原则 

随 着 医学 的 快速 发 展 , 基础 和 临床 研究 证 据 也 在 不 断 更 新 。 过 去 认为 有 效 的 治疗 手段 可 能 
被 新 的 证 据 证 明 无 效 , 而 过 去 认为 无 效 甚至 禁忌 的 治疗 手段 可 能 被 新 的 证 据 证 明 有 效 。 例 如 既 
往 认为 慢性 充血 性 心力 衰竭 是 使 用 B- 受 体 阻 灌 剂 的 禁忌 证 ,但 目前 大 型 随机 对 照 试验 一 致 证 
实 B- 受 体 阻 滞 剂 可 以 显著 改善 慢性 心力 衰竭 患者 的 预后 。 因 此 , 现 有 指南 ( 1 类 推荐 , A 级 证 
据 )pB- 受 体 阻 滞 剂 治疗 慢性 充血 性 心力 衰 竟 。 

(五 ) 后 效 评价 原则 

后 效 评 价 是 指 在 患者 接受 根据 CPG 制定 的 诊治 方案 后 , 继续 临床 随访 以 评价 患者 病情 的 
变化 。 后 效 评价 在 整个 循 证 临床 实践 中 具有 重要 作用 , 也 可 为 指南 的 修订 和 更 新 提供 临床 资 
料 。 例 如 目前 对 于 乙 型 肝炎 的 治疗 , 恩 蔡 卡 韦 疗 效 确定 ,已 成 为 一 线 抗 病毒 用 药 , 但 当 患 者 开 
始 使 用 后 , 仍 需 定期 复查 肝 功 能 及 病毒 DNA 量 , 以 评估 药物 的 有 效 性 . 及 时 发 现 可 能 出 现 的 醒 













二 、 临 床 实践 指南 的 应 用 技巧 

在 实际 临床 工作 中 , 临床 医生 应 用 CPG 应 注意 以 下 技巧 : 

1. 明确 该 指南 制定 的 方法 . 一 项 真正 的 、 以 循 证 为 基础 的 CPG 较 非 循 证 CPG 的 可 靠 性 更 强 

2. 了 解 并 分 析 指南 中 的 证 据 水 平 与 推荐 建议 强度 , 并 明确 它们 之 间 的 关系 . 以 便 判 断 推荐 
意见 的 可 靠 程度 。 

3. 依据 推荐 意见 强度 确定 是 否 应 用 于 临床 。 

4. 注意 消除 指南 的 实施 障碍 , 避免 指南 使 用 不 足 。 指 南 在 实施 过 程 中 总 会 遇 到 一 些 障碍 ， 
如 : @ 社 会 因素 障碍 , 像 某 些 新 的 治疗 措施 社保 不 予 支 付 ; @@ 个 人 因素 障碍 , 如 医 入 
言 目 使 用 指南 ; @) 环 境 因素 障碍 , 被 医药 宣传 信息 误导 , 脱离 指南 习惯 性 给 予 "常规 治疗 ”村 
此 外 , 在 应 用 指南 过 程 中 , 应 充分 重 闹 个 人 海通 能 力 的 重要 性 , 加 强 与 患者 及 家 届 的 沟通 
交流 , 既 可 增加 患者 及 家 属 对 指南 应 用 的 理解 , 也 是 临床 医生 正确 使 用 指南 、 进 行 个 体 化 临床 
决策 的 基础 。 同 时 在 选择 指南 时 , 应 尽 可 能 选择 由 本 地 区 或 本 国 制定 的 指南 。 但 遗 屿 的 是 我 国 





























制定 的 指南 大 多 为 传统 的 专家 共识 , 指南 质量 偏 低 。 而 在 选用 欧美 国家 指南 或 国际 性 指南 时 
应 充分 估计 到 本 地 人 群 的 基线 特征 、 医 疗 卫生 资源 的 分 布 , 这 些 都 可 能 与 指南 存在 差异 ,影响 


下 
| 





指南 的 具体 应 用 。 最 后 , 应 用 指南 时 应 充分 体现 循 证 医学 的 理念 , 即 根据 患者 的 具体 临床 情况 ， 
将 当前 所 获 最 佳 证 据 与 临床 技能 和 经 验 相 结 合 , 考虑 成 本 - 效益 比 及 当地 卫生 资源 的 实际 情 
况 , 并 在 充分 尊重 患者 及 其 亲属 的 价值 取向 和 意愿 的 基础 上 , 做 出 最 佳 的 、 综 合 性 的 临床 决策 

- ( 康 晓 阳 刘 金 来 ) 
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循 证 医学 是 把 新 近 最 佳 证 据 用 于 临床 适合 的 患 考 , 并 取得 最 佳 临床 诊治 效果 的 过 程 。 与 传 
统 医 学 的 区 别 在 于 , 循 证 医学 采用 科学 的 标准 严格 第 选 、 分 析 和 评价 拟 用 临床 研究 证 据 , 推崇 
使 用 最 佳 证 据 , 适时 更 新 证 据 , 并 对 临床 诊治 效果 进行 后 效 评价 , 进而 发 现 新 问题 , 开始 新 一 轮 
的 循 证 实践 过 程 。 

任何 临床 研究 证 据 和 成 果 都 是 源 于 临床 对 患者 个 体 特 征 的 观测 或 对 试验 性 干预 反应 的 总 
结 ,是 从 基于 个 体 特征 的 感性 认识 升华 为 对 群体 的 共性 认识 。 证 据 或 研究 结果 就 群体 而 言 是 真 
实 的 ,其 推广 和 应 用 对 改善 和 提高 患者 群体 的 疾病 防治 效果 会 有 积极 的 作用 。 然 而 针对 自己 的 
患者 个 体 , 可 能 与 证 据 来 源 群体 存在 特征 上 的 差异 , 比如 地 域 种 族 、 年龄 分 布 ,疾病 状态 .社会 
经 济 和 环境 背景 等 方面 。 能 否 将 从 群体 获得 的 最 佳 证 据 或 研究 结果 用 于 具体 的 个 体 患者 , 实现 
将 患者 个 体 化 特征 、 意 愿 / 价值 观 以 及 现 有 最 佳 证 据 的 有 机 结合 , 是 临床 医师 在 实践 循 证 医学 
时 需要 重视 的 问题 , 也 是 将 最 佳 证 据 转化 为 最 佳 临床 诊治 效果 的 重要 环节 。 
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实践 循 证 医学 的 证 据 , 应 该 是 新 近 最 佳 证 据 (best evidence)。 基 于 临床 流行 病 学 和 循 证 医 
学 的 方法 和 原则 , 最 佳 证 据 应 具备 以 下 特征 ; 


证 据 的 真实 性 (validity ) 指 研究 结果 与 实际 真实 结果 间 的 符合 程度 , 即 研究 结果 的 准确 性 。 
由 于 研究 设计 、 实 施 和 评价 过 程 有 诸多 影响 因素 , 导致 研究 结果 或 多 或 少 存在 与 实际 结果 之 间 
的 偏差 , 这 就 是 为 什么 同样 的 研究 设计 会 得 出 不 同 的 结论 的 原因 。 为 避免 伪证 据 或 夸大 效果 的 
研究 结论 对 临床 诊治 的 影响 , 对 拟 采 用 的 证 据 首先 必须 评价 其 真实 性 。 比 如 , 研究 报道 某 种 药 
物 治疗 高 血压 效果 显著 , 但 对 其 分 析 评 价 发 现 , 纳入 的 研究 对 象 没有 严格 的 诊断 标准 , 设立 的 
对 照 组 与 试验 组 基线 存在 明显 的 差异 , 临床 医师 应 对 此 研究 结论 提出 质疑 , 这 样 的 研究 结果 究 
竞 是 药物 真实 的 降 压 效 果 还 是 选择 偏 倚 造 成 的 ,能 否 用 于 临床 指导 值得 推 若 。 如 以 原始 研究 证 
据 为 例 , 基于 影响 研究 结果 的 主要 环节 , 从 以 下 几 方 面 进 行 真实 性 评价 : 全 研究 的 设计 方案 是 
否 合理 , 是 否 设 立 恰当 的 对 照 组 ; @ 四 研究 对 象 的 诊断 标准 及 其 纳入 和 排除 标准 是 否 明确 ; (加 组 
间 的 基线 是 否 可 比 \ 干 预 措施 和 方法 是 否 科学 有 效 和 安全 ; 图 终点 指标 是 否 确切 、 恰当; @) 干 预 
普 施 实施 及 结果 测量 、 分 析 和 报告 是 否 采用 育 法 ; @ 研 究 结 果 有 何 偏 倚 存 在 及 采取 了 哪些 防止 
和 处 理 方法 ; 患者 的 依从 性 如 何 , 随访 率 多 少 ; @ 资 料 收集 ,整理 ,统计 分 析 方 法 是 否 合理 等 。 
根据 不 同 的 设计 方案 及 可 能 产生 的 偏 倚 大 小 , 可 对 拟 采用 证 据 的 论证 强度 和 可 信 度 水 平 进行 分 
级 ,在 具体 应 用 中 优选 高 级 别 的 证 据 。 研 究 证 据 使 用 的 推荐 强度 分 为 5 级 , 即 T 级 [级 、 册 级 、 
了 级 和 V 级 , 具体 分 级 见 表 13-1。 
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表 13-1 牛津 证 据 分 级 与 推荐 强度 (2001 年 ) 
推荐 证 据 治疗 、 预 防 、 ras 
强度 级 别 病因 研究 预后 研究 诊断 性 研究 经 济 学 分 析 
I 级 Ia 基于 同 质 性 随机 对 照 基于 同 质 性 前 脆性 队 基于 同 质 性 一 流水 平 基于 同 质 性 一 流水 平 
试验 的 系统 评价 列 研究 的 系统 评价 ， 的 诊断 性 研究 的 系统 的 经 济 学 研究 的 系统 
或 经 验证 的 临床 实践 评价 ,或 经 验证 的 临床 评价 
指南 实践 指南 
Ib 可 信 区 间 罕 的 随机 对 随访 率 >80% 的 前 瞻 纳入 研究 对 象 适当 , 且 采用 适当 的 成 本 计 
照 试 验 性 队列 研究 与 金 标准 进行 了 同步 算 , 对 所 有 经 过 严格 
独立 盲 法 比较 的 诊断 验证 的 备 选 医疗 方案 
性 研究 的 结局 进行 了 比较 分 
析 , 包括 敏感 性 分 析 
Ic 观察 结果 为 “全 或 无 ”观察 结果 为 “全 或 无 ”绝对 的 特异 度 高 即 阳 对 干预 措施 分 析 后 
( 某 干预 措施 推行 前 的 病例 系列 研究 性 者 可 确诊 , 或 绝对 的 有 明确 结论 : 成 本 
某 病 病死 率 为 100%， 灵敏 度 高 即 阴性 者 可 低 、 其 结果 佳 的 程度 ; 
推行 后 低 于 100%， 排除 @@ 成 本 高 、 其 结果 差 
或 推行 前 某 病 患者 存 的 程度 ; @ 成 本 相同 、 
在 死亡 或 治疗 失败 现 其 结果 的 好 坏 程 度 
象 , 推行 后 无 死亡 或 
治疗 失败 ) 
1 级 ”Ifa 基于 同 质 性 队列 研究 同 质 性 回顾 性 队列 研 同 质 但 水 平 低 于 I 级 同 质 但 水 平 低 于 I 级 
的 系统 评价 究 , 或 对 照 组 未 治疗 的 诊断 研究 系统 评价 ”的 经 济 学 研究 系统 评 
的 、 基 于 随机 对 照 试 价 
验 的 同 质 性 系统 评价 
Ib 单个 队列 研究 (包括 回顾 性 队列 研究 ,或 同步 作 了 人 金 标准 及 诊 采用 适当 的 成 本 计 
低 质 量 的 随机 对 照 随机 对 照 试验 中 未 作 断 试验 , 并 进行 了 独立 算 , 对 若干 备 选 医疗 
试验 , 如 随访 率 低 于 治疗 的 对 照 组 患者 随 育 法 比较 , 但 研究 对 象 方案 的 结局 进行 了 比 
80% ) 访 结果 , 或 未 经 验证 局 限 且 不 连贯 ,或 未 经 较 分 析 , 包括 敏感 性 
的 临床 实践 指南 验证 的 临床 实践 指南 ”分析 
Ice 结局 性 研究 结局 性 研究 
了 级 ”而 a 基于 同 质 性 病例 对 照 一 a ss 
研究 的 系统 评价 
开 b 单个 病例 对 照 研究 ”一 纳入 研 究 对 象 适当 且 未 作 准 确 成 本 计算 的 
与 金 标准 进行 了 独立 经 济 学 研究 ,但 进行 
盲 法 比较 或 客观 比较 ， 了 敏感 性 分 析 
但 部 分 内 容 对 象 未 接 
受 金 标准 试验 的 诊断 
性 研究 
IV 级 系列 病例 观察 (包括 系列 病例 观察 (包括 未 采用 育 法 或 未 客观 无 敏感 性 分 析 的 经 济 
低 质量 的 队列 研究 和 低 质量 的 预后 队列 研 独立 地 使 用 金 标准 试 学 研究 
病例 对 照 研 究 ) 究 ) 验 的 诊断 性 研究 , 划分 
真 阳性 和 真 阴性 的 参 
考 标准 不 统一 、 或 纳入 
研究 对 象 不 适当 的 诊 
断 性 研究 
V 级 专家 意见 或 基于 生理 、 专 家 意见 或 基于 生理 、 专 家 意见 或 基于 生理 、 专 家 意见 或 基于 经 济 
病理 生理 和 基础 研究 病理 生理 和 基础 研究 病理 生理 和 基础 研究 学 理论 类 证 据 
类 证 据 类 证 据 类 证 据 





注 :* 结 局 性 研究 是 指 描述 、 解 释 、 预测 某 些 二 





F 预 或 危险 因素 对 最 终结 局 作用 和 影响 的 研究 
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二 .重要 性 


研究 结果 的 重要 性 (importance ) 指 其 临床 价值 和 意义 。 重 要 性 评价 应 建立 在 证 据 真实 的 
基础 上 , 否则 不 真实 的 证 据 就 没有 重要 性 可 言 。 不 同类 型 的 研究 证 据 , 重要 性 有 着 不 同 的 表达 

对 于 诊断 性 试验 , 重要 性 的 指标 反映 在 敏感 度 提高 了 多 少 , 敏感 度 高 的 诊断 试验 表明 漏诊 
率 低 , 用 于 疾病 的 筛 查 效果 好 ; 另 一 个 指标 是 特异 度 提高 了 多 少 , 特异 度 高 的 诊断 试验 误诊 率 
低 , 用 于 疾病 的 肯定 诊断 。 了 解 诊 断 试验 的 意义 , 有 助 于 自己 在 疾病 的 诊断 中 , 选择 恰当 的 诊 
断 方法 , 从 而 提高 临床 诊断 的 准确 度 。 

在 治疗 性 研究 的 证 据 中 , 需要 了 解 实施 了 干预 措施 后 , 能 使 疾病 的 治愈 率 提高 多 少 或 者 病 
死 率 及 病 残 率 降低 了 多 少 , 干预 措施 的 安全 性 如 何 。 在 权衡 利 称 后 , 选择 安全 有 效 的 措施 。 

在 疾病 预后 的 研究 中 , 要 分 析 不 同 预后 因素 (有 害 或 有 利 因素 ) 对 疾病 预后 的 影响 及 其 程度 。 

对 于 不 同 的 研究 结果 还 应 该 考虑 其 成 本 -效果 。 比 如 诊断 性 试验 的 应 用 , 使 每 增加 一 例 确 
诊 病 例 所 增加 的 成 本 是 多 少 , 或 治疗 性 研究 中 每 防止 一 例 不 良 结果 或 并 发 症 所 增加 的 成 本 等 。 

采用 定性 和 量化 的 指标 将 有 助 于 判断 临床 研究 结果 的 重要 程度 。 

三 .适用 性 

任何 最 佳 证 据 的 应 用 和 推广 , 都 必须 结合 病人 的 实际 情况 、 医 疗 条 件 、 医 务 人 员 的 知识 技 
能 水 平 、 患 者 的 接受 程度 以 及 社会 经 济 状况 的 承受 能 力 等 , 所 以 适用 性 (applicability ) 关 系 着 证 
据 应 用 和 推广 的 可 行 性 。 

来 源 于 不 同 国家 和 地 区 的 临床 研究 证 据 , 由 于 人 种 及 生物 学 上 的 差异 , 可 能 导致 不 同 反应 
的 出 现 ; 社会 文化 背景 的 差异 可 能 影响 证 据 的 接受 和 推广 ; 经 济 发 展 水 平 对 新 技术 和 新 药物 的 
应 用 有 着 明显 的 促进 或 制约 ; 医务 人 员 的 知识 水 平和 医疗 条 件 在 不 同 国家 和 地 区 的 差异 也 会 影 
响 证 据 的 使 用 。 对 来 源 于 不 同 国家 和 地 区 的 临床 研究 结果 , 其 引用 要 充分 考虑 上 述 的 差异 , 一 
定 要 结合 自己 病人 的 特点 , 具体 分 析 相 关 证 据 的 应 用 价值 及 可 行 性 , 不 能 育 目 照搬 。 


四 .经 济 性 


物美 价 廉 在 医疗 保健 领域 同样 适用 , 全 球 都 面临 着 卫生 资源 有 限 而 卫生 保健 需求 无 限 这 一 
了 矛盾。 如何 合 理 利用 有 限 的 卫生 资源 来 满足 人 们 对 健康 保健 日 益 增长 的 需求 , 不 仅 是 国家 层面 
需要 研究 和 解决 的 问题 , 同时 也 是 临床 医师 在 临床 实践 中 需要 面 对 的 问题 。 就 临床 最 佳 证 据 而 
言 , 在 真实 性 、 重 要 性 和 实用 性 的 原则 上 还 应 考虑 成 本 投入 和 诊疗 效果 产 出 的 比值 , 尤其 是 面 
临 多 种 方案 可 以 选择 时 , 应 该 比较 各 种 方案 单位 成 本 投入 的 效果 产 出 比值 或 单位 效果 产 出 的 成 
本 投入 比值 ,或 考察 增 量 成 本 -效果 比值 , 选择 和 推广 价 廉 物美 的 证 据 。 


五 .时 效 性 
临床 研究 的 动力 源泉 源 自 临床 实践 中 不 断 发 现 的 临床 问题 。 不 论 是 对 病因 的 探索 、 对 疾病 
诊断 准确 性 的 淘 求 ,还 是 对 疾病 良好 结局 的 期 许 都 会 促进 临床 研究 者 们 不 断 地 围绕 临床 需要 解 
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床 医生 正 是 在 不 断 的 发 现 问题 .提出 问题 和 解决 问题 的 过 程 中 ,对 问题 的 认识 更 趋 于 真实 , 促 
进 了 临床 医学 的 不 断 发 展 以 及 临床 医生 自身 水 平 的 不 断 提 高 。 比 如 绝经 期 妇女 激素 替代 治疗 ， 
激素 替代 治疗 (hormone replacement treatment, HRT) 在 降低 潮 热 .出 汗 、 失 眠 、 情 绪 改 变 .生殖 道 
凌 缩 .尿频 尿 急 和 骨 质 足 松 方面 的 效果 已 被 大 量 的 随机 对 照 试 验证 实 并 被 临床 广泛 接受 , 其 在 
预防 心血 管 疾病 .老年 痴呆 方面 的 作用 , 也 逐渐 被 发 现 。 激 素 蔡 代 治 疗 能 降低 总 胆固醇 .LDL， 
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提高 HDL 水 平等 , 似 血 管 保护 作用 , 但 在 一 级 预防 中 心 脑 血 管 病 风险 反而 增加 了 29%, 二 级 预 
防 中 非 致命 性 心肌 梗死 和 心 脑 血管 死亡 在 HRT 组 和 对 照 组 之 间 并 无 统计 学 差异 , 这 些 后 续 研 
究 结 果 让 盲目 热衷 于 HRT 预防 心 脑 血 管 疾病 的 热情 降温 。 但 证 据 的 应 用 者 们 通过 分 析 和 总 
结 , 发 现 了 研究 存在 的 问题 , 比如 入 选 的 研究 对 象 年 龄 跨度 大 , 人 选 年 龄 50~76 岁 ( 平 均 63 岁 )， 
其 中 60~69 岁 占 到 45.3%, 从 而 提出 激素 应 用 的 开始 时 间 与 血管 内 皮 的 完整 性 是 否 与 心 脑 血 管 
疾病 发 生 的 风险 相关 , 进而 提出 治疗 的 时 间 窗 问题 。 另 一 方面 , 激素 治疗 的 不 良 反应 也 一 直 困 
扰 临 床 医生 , 在 绝经 期 症状 改善 、 骨 量 丢失 减少 的 同时 , 也 引发 了 对 激素 与 子宫 内 膜 癌 、 和 乳腺 癌 
及 卵 梨 瘤 发 病 率 上 升 的 担忧 , 促使 人 们 开始 研究 激素 剂量 改变 、 肉 孕 激 素 联合 应 用 等 新 问题 。 
其 实在 这 一 领域 中 ,有 关 年 龄 、 BMI、 家 族 易 感激 素 使 用 的 时 间 、 有 无 心 脑 血管 疾病 史 都 可 能 
影响 最 后 结果 , 因此 来 自 群体 的 研究 结果 在 具体 病人 的 应 用 中 会 遇 到 各 式 各 样 的 问题 , 一 方面 
可 促使 临床 医生 进一步 查找 更 适合 的 证 据 , 另 一 方面 也 促进 了 相关 研究 的 开展 。 


二 节 ”生物 学 依据 


在 临床 研究 中 , 任何 科学 研究 的 设计 和 实施 都 应 以 生物 学 依据 (biologic evidence ) 为 研究 基 
础 。 在 证 据 的 应 用 中 也 要 考虑 临床 诊治 的 生物 学 依据 。 例 如 某 一 药物 治 病 的 效应 , 要 从 生物 学 
机 制 上 研究 药物 的 作用 环节 , 为 何 无 效 或 为 何 产生 不 良 反 应 都 应 有 相应 的 生物 学 机 制 。 

针对 发 病 机 制 ,有 关 病 原生 物 学 的 研究 在 感染 性 疾病 中 具有 很 重要 的 意义 。 比 如 结核 病 的 
病原 体 是 结核 杆菌 , 应 用 抗 结核 杆菌 的 药物 能 够 有 效 地 控制 结核 病 的 发 展 并 治愈 结核 病 。 病 毒 
性 肝炎 的 病原 体 是 肝炎 病毒 , 乙 型 肝炎 病毒 所 致 的 慢性 迁延 性 肝炎 与 肝癌 的 发 生 有 很 强 的 关联 
性 , 而 目前 针对 乙 型 肝炎 病毒 的 治疗 药物 还 不 尽 如 人 意 。 肿 瘤 的 发 病 机 制 比较 复杂 , 在 长 期 的 
观察 和 研究 中 发 现 , 人 乳头 瘤 病 毒 (HPV ) 部 分 类 型 的 感染 与 生殖 道 肿瘤 有 明显 的 相关 性 , 比如 
HPV16、HPV18、HPV33、HPV52 等 感染 与 宫颈 癌 的 发 生 有 密切 关系 。 针 对 病毒 感染 相关 的 疾 
病 , 由 于 缺乏 直接 杀 灭 病毒 的 药物 , 主要 还 是 通过 研究 相关 疫苗 来 预防 感染 , 或 通过 干扰 素 诱 
导体 内 细胞 产生 抗 病毒 蛋白 以 及 调节 体内 免疫 系统 来 减少 和 控制 病毒 。 这 些 都 涉及 病原 体 至 
病 与 抗 病原 体 药物 作用 的 生物 学 依据 。 

从 基于 人 群 的 流行 病 学 研究 或 基于 临床 病人 的 观察 总 结 , 常常 会 发 现 不 同人 种 或 个 体 之 间 
存在 生物 学 上 的 差异 。 例 如 黑人 的 高 血压 发 病 率 较 其 他 人 种 高 且 危 害 重 , 临床 证 明 有 效 的 B- 
受 体 阻 沾 剂 、 血 管 紧张 素 酶 抑制 剂 , 对 黑人 高 血压 患者 的 治疗 效果 , 较 利尿 剂 差 ; 同时 血管 紧张 
素 酶 抑制 剂 引起 的 血管 性 水 肿 显著 , 较 其 他 人 种 的 发 病 率 高 。 在 丙 型 肝炎 的 治疗 中 也 发 现 , 黑 
人 对 育 乙 二 醇 干扰 素 - 加 利 巴 韦 林 治 疗 的 持续 病毒 应 答 ( sustained virus response, SVR ) 率 较 白 种 
人 低 。 家 族 遗 传 性 也 体现 在 疾病 的 发 病 率 和 对 药物 的 反应 性 上 的 差异 。 比 如 乳腺 癌 、 卵 巢 癌 和 
结肠 癌 有 家 族 聚 集 的 倾向 , 发 病 的 风险 高 于 普通 人 群 。 因 此 在 疾病 防治 中 要 注意 人 种 、 民 族 和 
遗传 因素 的 生物 学 特点 。 

临床 治疗 中 还 观察 到 , 使 用 抗生素 治疗 感染 性 疾病 过 程 中 , 同一 种 致 病菌 存在 对 同一 种 抗 
生 素 的 敏感 菌株 和 耐 药 菌株 ,或 在 抗生素 不 断 使 用 中 渐渐 产生 对 抗生素 耐 药 的 现象 。 在 肿瘤 病 
人 的 化 疗 治疗 中 , 同一 种 组 织 来 源 的 肿瘤 , 也 观察 到 化 疗 敏 感性 或 耐 药 性 的 差异 。 这 些 差 异 的 
存在 和 产生 都 需要 研究 者 去 探索 其 相应 的 生物 学 机 制 , 从 细胞 甚至 分 子 水 平 上 予以 解决 , 以 期 
为 患者 制订 个 体 化 的 诊疗 方案 。 比 如 , 对 于 两 型 肝炎 的 治疗 , 经 过 长 期 的 研究 , 将 传统 的 干扰 
素 聚 乙 二 醇化 , 使 其 被 包 庄 后 阻止 了 蛋白 酶 的 水 解 , 减少 了 分 子 的 免疫 原 性 , 大 分 子 干扰 素 还 
防止 了 肾 小 球 的 滤 过 , 使 之 比 普通 干扰 素 更 快 地 达到 血 药 高 峰 浓度 , 改变 了 普通 干扰 素 不 稳定 
的 血 药 浓度 高 峰 低谷 现象 , 并 能 维持 较 长 的 时 间 。 聚 乙 二 醇化 的 结果 提高 了 丙 型 肝炎 治疗 的 
SVR 率 , 这 是 两 型 肝炎 治疗 上 的 一 大 进步 。 和 白介素 -28B(IL-28B ) 基 因 编 码 免疫 应 答 调 节 带 , 近 
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年 来 研究 发 现 IL-28B 存在 基因 多 态 性 , 并 与 两 型 肝炎 治疗 的 效果 密切 相关 : rs12979860 纯 合 子 
基因 型 (CC ) 患 者 对 标准 治疗 法 的 SVR 率 是 基因 携带 阴性 (TT) 患 者 的 2 倍 。 在 不 同人 种 CC 概 
率 差异 很 大 , 东亚 人 最 高 , 非洲 裔 美国 人 最 低 。 蛋 白 酶 抑制 剂 boceprevir 和 telaprevir 已 被 通过 
用 于 治疗 两 型 肝炎 , 在 1 型 丙 型 肝炎 病毒 感染 的 CC 患者 , 与 传统 的 聚 乙 二 醇 干扰 素 - 加 利 巴 韦 
林 (PR ) 二 联 用 药 的 标准 方案 比较 , 加 用 蛋白 酶 抑制 剂 的 三 联 药物 治疗 方案 的 SVR 率 为 90% 和 
70% ,而 TT 患者 为 70% 和 30%, 提示 IL-28B 指导 下 选用 三 联 或 二 联 药物 治疗 方案 , 可 能 获得 最 
佳 成 本 -效果 。rs8099917 纯 合子 GG 则 是 丙 型 肝炎 治疗 的 不 良 预后 基因 。 等 位 基因 CC 和 GG 
的 发 现 , 为 丙肝 治疗 个 体 化 方案 的 制订 提供 了 可 遵循 的 生物 学 依据 。 

随 着 人 类 基因 计划 研究 的 深入 , 对 于 个 体 基因 遗传 特征 与 疾病 的 临床 表象 的 关系 探讨 , 尤 
其 是 单 核 苷 酸 多 态 性 与 疾病 发 生 及 临床 用 药 敏感 性 的 预测 , 可 能 为 今后 临床 研究 和 诊治 提供 更 
多 的 个 体 方 面 的 生物 学 依据 。 























三 节 ”病理 生理 学 依据 


临床 实践 中 , 疾病 的 发 生 、 病 情 轻 重 、 并 发 症 发 生 、 结 局 以 及 临床 干预 措施 对 疾病 的 影响 都 
有 相应 的 病理 生理 变化 和 特点 。 临 床 研究 中 若 纳入 不 同 病 理 生理 状态 的 研究 对 象 , 不 仅 临床 表 
现 千差万别 , 对 诊疗 措施 的 反应 也 大 相 径 庭 。 在 证 据 的 应 用 中 要 考虑 患者 的 病理 生理 状态 以 及 
治疗 过 程 中 的 病理 生理 反应 。 例 如 , 曾 在 我 国 流行 的 SARS, 部 分 中 毒 症 状 及 肺 部 炎 变 损害 明 
显 、 呼 吸 功能 明显 障碍 者 , 适时 适量 的 应 用 肾上腺 皮质 激素 治疗 , 取得 了 较 好 的 临床 效果 , 挽救 
了 不 少 病人 的 生命 。 但 对 于 中 毒 症状 以 及 肺 部 损害 不 严重 、 呼 吸 功能 影响 较 轻 的 患者 , 应 审慎 
应 用 激素 , 避免 因 给 药 带 来 不 良 后 果 ( 如 股骨 头 坏死 )。 

任何 最 佳 证 据 的 应 用 , 一 定 要 仔细 考虑 患者 由 于 病理 生理 损害 不 同 而 导致 临床 病情 的 复杂 
性 。 临 床 研究 的 成 果 , 由 于 样本 量 的 限制 , 就 研究 对 象 而 言 , 相对 单纯 同 质 , 因而 即使 是 最 佳 证 
据 , 对 临床 的 总 体 代表 性 而 言 , 往往 有 其 局 限 性 。 如 果 患 者 病情 与 研究 对 象 存 在 差异 , 比如 病 
情 轻 重 不 一 致 ,年龄 、 性 别 或 并 发 症 有 差异 , 就 有 可 能 在 机 体 功能 、 代 谢 及 药物 的 反应 方面 都 存 
在 不 同 , 因而 证 据 的 应 用 就 不 宜 简单 照搬 。 例 如 : 对 轻 、 中 型 高 血压 患者 降 压 的 随机 对 照 试验 
俩 究 , 证 明了 钙 离子 通道 阻 兆 剂 及 血管 紧张 素 酶 I 受 体 阻 洁 剂 有 良好 的 降 压 效果 , 如 果 面 对 的 
患者 是 一 位 3 级 高 血压 患者 (BP>180/110mmHg), 或 者 伴 有 心 脑 器 官 损伤 或 有 其 他 并 发 症 或 合 
并 症 等 的 高 危 患 者 ,单一 降 压 药物 应 用 就 不 能 达到 有 效 降低 血压 并 预防 心 脑 血 管 并 发 症 的 预期 
效果 。 因 此 , 应 注意 被 引用 的 证 据 中 , 纳入 的 研究 对 象 有 无 1、2、3 级 高 血压 或 低 、 中 、 高 危险 分 
层 , 如 有 3 级 或 伴 有 相关 并 发 症 的 高 危 患者 , 且 与 该 患者 病情 相似 , 那么 相应 的 证 据 就 有 被 采纳 
的 价值 。 否 则 , 另 当 别论 。 

在 估价 疾病 预后 和 对 有 关 危 险 因素 的 干预 , 借以 改善 患者 预后 、 提 高 患者 的 生存 质量 , 这 
就 要 求 将 多 种 相关 因 素 的 研究 证 据 , 结合 患者 疾病 的 病理 生理 特点 进行 具体 分 析 和 评价 , 以 估 
计 可 能 发 生 某 一 事件 的 概率 并 提出 有 针对 性 的 干预 方案 , 从 而 防止 或 降低 不 良 事件 的 发 生 , 以 
达到 改善 患者 预后 的 目的 。 



































第 四 节 ”社会 -心理 及 经 济 特点 


在 国家 层面 上 , 鉴于 不 同 国家 和 地 区 , 社会 制度 .人 文 和 自然 环境 、 经 济 发 展 水 平和 人 群 
的 受 教育 程度 存在 着 极 大 的 差异 ,这些 差异 不 仅 体现 在 临床 研究 的 切入 点 和 实施 不 同 , 也 会 
在 证 据 的 推广 应 用 中 存在 差异 。 例 如 : 10 年 前 , 发 达 国 家 在 新 药 和 新 的 干预 措施 的 评价 中 ， 
增 量 成 本 <50 000 美元 /QALY, 即 作为 可 以 接受 的 标准 。 而 在 发 展 中 国家 和 贫困 国家 , 每 增加 
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1QALY, 将 多 付出 40 万 元 人 民 币 的 成 本 ,无 论 从 国家 层面 、 社 会 层面 或 个 人 层面 , 负担 都 难以 
承受 。10 年 以 后 , 美国 的 标准 已 达到 100000 美元 /QALY。 按 照 2011 年 世界 银行 的 统计 , 美国 
人 均 GDP 达到 48 442 美元 , 而 中 国人 均 GDP 为 8466 美元 , 100 000 美元 约 为 美国 人 均 GDP 的 
2.1 倍 ,为 中 国人 均 GDP 的 12 倍 。 根据 WHO 药物 经 济 学 的 推荐 意见 (2010): 增 量 成 本 - 效果 比 
(incremental cost-effective ratio, ICER )< 人 均 GDP, 增加 的 成 本 完全 值得 ; 人 均 GDP<ICER<3 倍 
人 均 GDP, 增加 的 成 本 可 以 接受 ; ICER >3 信人 均 GDP, 增加 的 成 本 不 值得 。 所 以 引用 发 达 国 
家 的 标准 , 应 慎重 。 再 者 不 同 发 展 水 平 的 国家 和 地 区 , 所 面临 的 疾病 负担 和 急需 解决 的 问题 也 
有 很 大 不 同 , 例如 宫颈 癌 是 发 展 中 国家 妇女 常见 的 恶性 肿瘤 之 一 , 极 大 地 危害 着 女性 健康 。 宣 
颈 脱落 细胞 学 检查 已 经 成 为 经 典 的 宫颈 癌 筛 查 手段 , 并 被 全 世界 广泛 接受 和 采纳 。 但 在 一 些 贫 
困 国 家 和 地 区 , 由 于 资源 匮乏 和 技术 人 员 缺 乏 , 醋酸 试验 或 碘 着 色 通 过 肉眼 观察 被 用 来 取代 细 
胞 学 筛 查 。 而 且 宫颈 癌 筛 查 的 宣传 和 人 们 对 其 重要 性 的 认识 以 及 传统 观念 影响 使 该 方法 的 接 
受 程度 与 发 达 国 家 相 比 , 也 大 大 落后 。 在 这 样 的 地 方 , 如 果 再 推行 HPV 检测 联合 宫颈 脱落 细胞 
学 筛 查 宫颈 癌 及 瘤 前 病变 , 就 显得 勉 为 其 难 了 。 相 反 , 发 展 中 国家 根据 当地 的 经 济 发 展 水 平 、 
宗教 和 文化 现状 , 针对 一 些 对 当地 人 群 健康 危害 大 的 疾病 如 急性 传染 病 、 呼吸 道 感染 、 腹 泻 、 营 
养 不 良 、 地 方 病 等 的 防治 性 研究 , 或 者 诸如 上 述 的 宫颈 癌 肉 眼 筛 查 法 等 行 之 有 效 的 证 据 , 在 发 
达 国 家 可 能 就 没有 如 此 重要 的 价值 。 

医生 的 知识 水 平 是 循 证 医学 实践 不 可 或 缺 的 要 素 。 能 充分 运用 临床 基本 知识 和 积累 的 经 
验 , 结合 具体 病人 的 实际 问题 , 搜寻 和 查找 新 近 最 佳 证 据 为 患者 诊治 服务 , 这 是 一 个 优秀 临床 
医生 的 职责 所 在 。 医 生 是 否 具 备 循 证 医学 实践 的 知识 , 能 否 在 众多 的 研究 结果 中 筛选 到 最 佳 证 
据 , 是 否 具有 对 先进 研究 成 果 的 敏锐 观察 力 , 都 关系 着 循 证 医学 实践 的 最 终 效果 。 

在 最 佳 证 据 的 应 用 中 , 患者 的 意愿 (preference ) 也 不 应 被 忽视 。 病 人 的 依从 性 受 自身 文化 
水 平 、 社 会 经 济 状况 、 价 值 观 甚至 宗教 信仰 的 影响 。 了 解 患 者 的 心理 及 所 处 的 社会 经 济 状态 ， 
倾听 患者 对 治疗 的 意见 , 尊重 他 们 的 价值 观 , 给 予 患者 相关 的 医学 知识 教育 , 加 强 医 患 交流 , 消 
除 患者 可 能 存在 的 顾虑 , 尽 可 能 地 给 患者 提供 方便 的 服务 , 并 与 患者 建立 良好 医 患 关系 , 提高 
他 们 的 依从 性 , 让 患者 愿意 接受 最 佳 证 据 指导 的 治疗 , 是 实践 循 证 医学 的 基础 。 


















































第 五 节 ”证 据 的 应 用 要 权衡 利 浆 


最 佳 证 据 是 否 可 以 用 于 指导 个 体 患者 的 医疗 决策 , 一 个 显而易见 的 问题 是 : 拟 采用 的 诊治 
措施 能 给 患者 带 来 多 大 的 利益 , 同时 还 要 考虑 它们 被 应 用 后 可 能 产生 哪些 不 良 反 应 及 其 对 患者 
造成 的 危害 程度 。 所 谓 “ 利 "是 指 临床 干预 措施 给 患者 带 来 的 临床 治疗 获 益 , 即 疾病 缓解 的 程 
度 、 治 愈 的 可 能 性 等 , 而 " 弊 " 则 指 不 良 反应 的 大 小 及 危害 程度 。 临 床 经 济 学 的 角度 还 要 考虑 成 
本 - 效果 比值 。 所 以 在 证 据 的 应 用 中 要 客观 评估 临床 诊治 措施 对 患者 的 利 与 整 , 选择 利 大 于 册 
的 证 据 。 

临床 意义 或 价值 有 很 多 评价 和 表述 的 指标 , 一 些 量化 的 指标 更 有 利于 医生 间或 医 患 间 的 交 
流 。 下 面 为 不 同 研究 领域 的 常用 指标 : 

病因 及 危险 因素 研究 证 据 : 常 采用 事件 发 生 率 (event rate, ER ), 相对 危险 度 (relative risk, RR )， 
归 因 危险 度 (attribute risk, AR), 病因 学 分 数 (etiologic fraction, EF ), 优势 比 (odds ratio, OR ), 绝对 
危险 增高 度 (absolute risk inerease, ARI), 相对 危险 增高 度 (relative risk increase, RRI), 暴露 多 少 
研究 对 象 可 导致 一 例 发 病 (number needed to harm, NNH )。 

诊断 学 研究 证 据 : 采用 的 指标 有 敏感 度 (sensitivity ,SEN ), 特异 度 (specificity, SPE ), 准确 度 
(accuracy ), 预测 值 (predictive value, PV ), 似 然 比 (likelihood ratio, LR )。 

治疗 及 干预 性 研究 证 据 : 常用 指标 包括 治愈 率 , 有 效率 , 病死 率 , 绝对 危险 隆 低 度 (absolute 
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risk reduction, ARR ), 相对 危险 降低 度 (relative risk reduction, RRR ), 治疗 多 少 患 者 可 获得 一 例 效 
果 (number needed to treat,NNT )。 

临床 经 济 学 研究 证 据 : 根据 研究 的 目的 、 待 评价 的 效果 可 选择 成 本 最 小 化 分 析 (cost-minimization 
analysis, CMA )、 成 本 -效果 分 析 (cost-effectiveness analysis, CEA )、 成 本 -效益 分 析 (cost-benefit 
analysis, CBA ) 和 成 本 - 效用 分 析 (cost- -utility analysis, CUA )。 其 量化 指标 有 最 小 成 本 、 成 本 - 效 
果 比 、 成 本 -效益 比 和 成 本 -效用 比 以 及 增 量 成 本 -效果 比 等 。 

临床 研究 发 生 的 不 良 事件 , 尤其 是 与 所 采取 的 诊疗 措施 相关 的 不 良 反应 , 如 药物 不 良 反 
(adverse drug reaction, ADR ), 要 作为 证 据 的 “ 浆 ” 加 以 关注 。 在 循 证 医学 个 体 化 实践 中 ， 0 
不 良 反应 的 严重 程度 ( 比如 是 否 对 脏 器 功能 造成 损伤 及 损伤 的 程度 , 损伤 是 否 可 逆 ), 重要 事件 
( 致 残 、 致 死 ) 率 的 高 低 都 要 认真 思考 。 其 他 指标 如 : 治疗 多 少 病例 才 发 生 一 例 重 要 的 不 良 事 件 
(NNH), 预防 或 治疗 药物 不 良 反 应 或 重要 不 良 事件 所 投入 的 成 本 是 多 少 , 以 及 由 此 带 来 的 增 量 
成 本 -效果 比 (incremental cost-effective ratio ) 等 。 

对 研究 证 据 利弊 评价 的 最 终 目 的 是 要 为 自己 面 对 的 具体 患者 的 诊治 做 出 决策 , 根据 利弊 比 
(likelihood of being helped vs harmed, LHH ) 来 衡量 证 据 应 用 可 能 为 患者 带 来 的 最 佳 效 果 和 不 良 
反应 。 比 如 某 种 防治 措施 的 NNT 为 10, NNH 为 30, 即 此 种 措施 的 利弊 比 (LHH)= 1/10: 1/30, 约 
为 3:1。 意 为 该 措施 对 患者 带 来 的 受益 3 倍 于 危害 。 但 这 一 结果 ( 利 大 于 浆 ) 并 不 是 决策 的 最 终 
依据 ， 还 要 进一步 结合 合 专业 及 临床 实际 , 考虑 患者 对 结果 的 意愿 及 价值 取向 来 校正 LHH, 并 最 
后 决定 是 否 采用 该 措施 。 表 13-2 可 通过 获得 的 NNT 及 NNH 查 得 利弊 比 。 











表 13-2 干预 效果 的 利 次 比 (LHH ) 
比值 NNT 
LUNNH U0 120 130 140 150 Il 170 180 190 1100 
1/10 1.0 0.5 0.3 0.3 0.2 0.2 0.1 0.1 0.1 0.1 
1/20 2.0 1.0 0.66 0.5 0.4 034 0.3 0.3 0.2 0.2 
1/30 3.0 js 1.0 0.75 0.6 0.5 0.4 0.4 0.3 0.3 
1/40 4.0 2.0 fa 1.0 0.8 0.7 0.6 0.5 0.4 0.4 
1/50 5.0 25 1.7 1.3 1.0 0.9 0.7 0.7 0.6 0.5 
1/60 6.0 3.0 2.0 13 1 1.0 0.8 0.8 0.8 0.6 
1/70 7.0 3.5 23 1.8 1.4 1 1.0 0.9 0.8 0.7 
1/80 8.0 4.0 2.6 2.0 1.6 1.4 1.1 1.0 0.9 0.8 
1/90 9.0 4.5 3.0 2.3 1.8 1.5 1.3 1.2 1.0 0.9 
1/100 10 5.0 3.3 2.5 2.0 by 1.4 8 1.1 1.0 














第 六 节 ”个 体 化 干预 的 效果 预测 


“最 佳 证 据 ” 应 用 于 循 证 医学 实践 对 个 体 患者 之 干预 , 究竟 会 产生 什么 效果 ? 可 能 达到 什么 
结局 ”这 是 患者 和 医生 都 十 分 关注 并 期 望 回 答 的 实际 问题 。 
0 和 
串 者 ， 男性 ,70 ) 岁 ， 患 高 血压 病 有 20 年 病程 ， 一 直 在 用 药物 进 治疗 , 但 血压 维持 在 
150/90mmHg 左右 ,疗效 欠 满 意 。3 年 前 发 现 糖尿 病 (2 型 ), 接 A , 血糖 维持 
在 6.0~6.5mmol/L, 且 血 脂 代谢 紊乱 , 甘油 三 酯 2.5mmol/L, 血 胆固醇 6.5mmol/L, HDL-Ch 
0.8mmol/L, LDL-Ch 3.8mmol/L。 肝 、 肾 功能 正常 
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患者 有 18 年 的 吸烟 史 , 现 10 支 /日 。 戒 烟 困难 。 
查 体 : 体型 稍 胖 ,身高 172cm, 体重 74kg, BP 150/94mmHg, 心脏 无 异常 体征 , 双 肺 正 
常 , 肝 脾 不 大 , 下肢 不 肿 。 心 电 图 正常 。 











患者 就 医 的 目的 : 四 询问 根据 现 况 发 生 冠 心病 或 脑 卒中 的 危险 度 有 多 大 ? @@ 如 何 进行 有 效 
的 治疗 以 降低 发 生 心 脑 血管 病 的 危险 性 ? 

根据 数 十 年 来 的 大 量 的 流行 病 学 研究 结果 所 获得 的 可 靠 证 据 , 明确 了 心 脑 血管 疾病 发 病 的 
主要 危险 因素 , 见 表 13-3。 





表 13-3 心 脑 血管 疾病 的 危险 因素 


高 血压 (1~3 级 ) 早 发 心血 管 疾 病 家 族 史 ( 一 级 亲属 年 龄 发 病 <50 岁 ) 

年 龄 (男性 >55, 女性 >65) 腹 型 肥胖 (腰围 : 男性 >90cm, 女性 >85cm) 或 肥胖 (BMI>28kg/m’) 
吸烟 

糖 耐 量 受 损 和 (或 ) 空 腹 血糖 异常 

血脂 异常 


(摘自 《中 国 高 血压 防治 指南 ) 第 3 版 ) 


从 表 13-3 所 列 的 心 脑 血 管 疾病 的 危险 因素 中 , 本 病例 具有 发 生 心 脑 血管 病 的 危险 因素 
为 : 高 血压 、 吸 烟 、 血 脂 闪 乱 、 糖 尿 病 、 年 龄 > 55 岁 共 5 项。 虽然 患者 现在 尚 无 心 脑 血 管 病 
的 临床 证 据 , 但 发 生 的 概率 在 未 来 是 颇 高 的 。 然 而 这 仅仅 是 定性 的 结论 。 是 否 有 定量 化 的 预 
测 指 标 呢 ?” 如 果 有 , 那么 进行 有 针对 性 的 干预 后 是 否 可 以 表明 发 生 心 脑 血管 病 的 危险 度 会 降 
低 呢 ? 

现在 让 我 们 分 别 引用 中 国医 学 科学 院 阜 外 医院 国家 “十 五 "攻关 课题 总 结 的 有 关 缺 血性 心 

管 疾病 (ICVD ) 综 合 危 险 度 评 估 工 具 图 .13-1, 可 为 本 例 患 者 进行 评估 。 

根据 图 13-1, 该 患者 年 龄 >59 岁 计 4 分 ,SBP 计 2 分 ,体质 指数 (BMI: 74kg/1.72m2=25) 计 1 
分 ,胆固醇 计 1 分 , 吸烟 计 2 分 , 糖尿 病 计 1 分 , 总 分 为 11 分 。 从 第 三 步 图 中 可 查 出 未 来 10 年 
发 生 ICVD 的 危险 度 为 12.8%。 

国外 的 定量 评估 ICVD 工具 中 ,也 颇 有 重要 参考 价值 , 同样 可 用 于 对 尚未 发 生 缺 血性 心血 管 
疾病 的 患者 的 预测 , 或 作 干 预后 估价 危险 度 下 降 的 效果 预测 , 这 里 , 要 推荐 新 西 兰 高 脂 血 症 及 高 
血压 管理 指南 中 所 列 “估计 心血 管 疾病 的 危险 与 治疗 益处 ( estimating cardiovascular risk and treatment 
benefit)”。 在 该 资料 中 ,确定 心血 管事 件 为 : 新 发 的 心绞痛 、 心 肌 梗死 、 冠 心病 死亡 、 卒 中 或 短暂 
性 脑 缺 血 改作、 充血 性 心 衰 或 外 周 血管 综合 征 。 

研究 者 根据 主要 危险 因素 的 研究 结果 来 预测 未 来 5 年 内 发 生 上 述 心 脑 血管 事件 的 危险 度 。 
如 经 过 干预 后 , 视 这 些 可 控 危险 因素 的 变化 , 以 确定 治疗 将 带 来 的 益处 。 

为 了 形象 化 的 指导 干预 实践 , 他 们 绘制 了 多 维 图 ( 见 彩 图 13-2)ICVD 预测 危险 度 与 干预 效 
果 图 。 

彩 图 13-2 中 主要 变量 为 : 性 别 、 年 龄 有 无 糖尿 病 、 吸 烟 与 否 、 血 压 水 平 、 总 胆固醇 /高 密度 
脂 蛋 白 胆 固 醇 (HDL-Ch ) 的 比例 , 共 6 大 项 。 图 中 以 不 同 颜色 的 小 方块 图 示 所 查 病 例 发 生 ICVD 
的 危险 程度 。 

在 判断 危险 度 及 其 治疗 获 益 方面 , 列 出 表 13-4。 

基于 总 胆固醇 下 降 20% 或 SBP 下 降 10~15mmHg 或 DBP 下 降 5$~10mmHg, 估计 CVD 事件 5 
年 约 下 降 1/3。 
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循 证 医学 的 个 体 化 实践 
缺 血性 心血 管 疾病 (ICVD) 综 合 危险 度 评 估 工 具 
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13-1 ” 缺 血性 心血 管 疾病 (ICVD ) 综 合 危险 度 评估 工具 





应 用 这 份 图 表 , 查看 该 病例 5 年 内 发 生 CVD 的 几率 。 该 例 为 男性 ,有 糖尿 病 、 吸 烟 、 血 压 


150/94mmHg .TC/HDL 
危 性 ,应 予 积极 治疗 ， 
危险 性 会 大 

临床 医学 的 研究 





=8.1。 查 彩 图 13-2 显示 为 红色 小 块 , 表示 5 年 内 发 生 CVD 者 >30%。 高 
如 果 能 有 效 降低 血压 , 控制 糖尿 病 及 高 脂 血 症 和 戒烟 , 则 可 望 发 生 CVD 


大 下 降 。 其 降低 水 平 仍 可 查 图 确定 , 这 将 取决 于 对 病人 的 干预 及 其 效果 。 
工作 , 就 是 要 获得 对 防 病 治 病 有 价值 的 成 果 。 然 后 又 将 其 应 用 于 防 病 治 病 


的 具体 实践 , 在 实践 中 进一步 评估 临床 效果 , 并 从 具体 的 患者 个 体 应 用 中 发 现 新 间 题 , 以 此 不 





断 提高 临床 诊治 的 水 了 


EF, 达到 保障 人 民 健 康 的 最 终 目的 。 循 证 医学 临床 实践 应 遵循 个 体 化 的 原 


则 , 以 最 终 解 决 患者 个 体 的 重要 实际 问题 。 
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表 13-4 心血 管 疾病 (CVD ) 的 危险 度 和 治疗 获 益 方面 估价 表 








危险 水 平 益处 (1) 益处 (2) 

(5 年 发 生 致死 与 非 致死 CVD ) (5 年 治疗 100 人 可 防御 CVD) (治疗 5 年 的 NNT) 
非常 高 红色 >30% >10% <10 
深 榨 色 25%~30% 9% 11 
淡 枪 色 20%~25% 7.5% 13 
高 黄色 15%~20% 6% 16 
中 绿色 10%~15% 4% 25 
低 蓝 色 5%~10% 2.5% 40 
紫色 2.5%~5% 1.25% 80 
淡 蓝 <2.5% <0.8% 120 








第 十 四 章 决策 分 析 


决策 分 析 是 通过 决策 模型 再 现 问题 、 利 用 概率 和 结局 估计 值 等 , 帮助 确定 最 佳 行动 方案 的 
一 个 过 程 。 决 策 分 析 目 前 已 有 一 套 基本 的 理论 与 方法 , 如 Bayes 决策 法 、 决 策 树 、Markov 模型 
等 ; 正确 决策 的 前 提 是 充分 掌握 准确 的 .有 价值 的 信息 和 正确 的 预后 预测 。 决 策 类 型 一 般 分 为 
确定 型 决策 、 风 险 型 决策 和 不 确定 型 决策 , 其 中 绘制 决策 树 、 各 事件 的 发 生 概率 和 结局 的 定量 
估计 是 风险 型 决策 的 三 大 要 素 ; 敏感 性 分 析 、 阔 值 分 析 和 决策 追踪 是 确保 决策 正确 的 重要 措施 。 
尽管 临床 决策 分 析 的 方法 尚 不 完善 , 但 决策 的 思想 及 其 思维 方式 , 对 于 临床 医生 来 说 , 仍 至 关 
重要 。 


第 一 节 概 述 


决策 (making decision ) 是 基于 不 确定 性 的 问题 , 通过 一 些 方法 与 手段 , 从 众多 备 选 方案 中 
选 定 最 优 方案 的 一 个 过 程 。 决策 分 析 ( making decision analysis ) 则 是 通过 决策 模型 再 现 问题 、 利 
用 概率 和 结局 估计 值 等 , 帮助 确定 最 佳 行动 方案 的 一 个 过 程 。 而 临床 决策 分 析 (clinical decision 
analysis, CDA ) 是 指 由 医务 人 员 参 与 实施 的 、 针 对 疾病 的 诊断 和 防治 过 程 中 风险 与 获 益 的 不 确 
定性 , 通过 查阅 文献 资料 , 充分 掌握 证 据 , 特别 是 在 掌握 最 新 最 佳 证 据 的 基础 上 , 结合 以 往 临床 
经 验 和 患者 的 实际 情况 , 分 析 比 较 两 个 或 两 个 以 上 可 能 的 备 选 方案 , 从 中 选择 最 优 者 来 进行 临 
床 实践 的 决策 过 程 。 

在 临床 实践 中 , 当 掌握 了 患者 的 全 部 情况 、 明 确 了 需要 解决 的 临床 问题 , 以 及 找 出 了 解决 
这 些 问题 的 最 佳 证 据 之 后 ,那么 就 要 对 患者 的 诊治 处 理 进行 具体 的 临床 决策 分 析 , 而 后 做 出 正 
确 的 决断 。 决 策 正确 与 否 取决 于 3 个 前 提 条 件 : 备 选 方案 是 否 齐全 、 各 事件 的 概率 估计 是 否 准 
确 、 结 局 的 定量 是 否 合情合理 。 无 论 是 对 概率 还 是 结局 的 定量 估计 ,都 应 来 自 证 据 充 分 的 临床 
研究 或 文献 资料 。 因 此 ,决策 前 , 应 开展 相应 的 循 证 医学 研究 , 通过 广泛 调查 文献 复 习 、 科 学 
分 析 , 以 充分 掌握 基础 信息 , 进而 选用 论证 强度 高 的 结果 评价 备 择 方案 , 或 应 用 准确 的 概率 来 
描述 事件 的 不 确定 性 , 以 及 使 用 合理 的 效用 值 来 定量 描述 结局 , 然后 计算 各 备 择 方案 的 期 望 值 ， 
从 中 选择 收益 最 大 者 , 应 用 于 临床 实践 。 

进行 临床 决策 的 难点 在 于 缺乏 各 种 决策 证 据 , 如 干预 后 出 现 的 各 种 结局 事件 常 不 确定 , 临 
床 事件 的 发 生 不 以 人 的 意志 为 转移 , 虽 可 预测 , 但 发 生 概率 难以 确定 ; 同时 鉴于 各 种 备 选 方案 
都 有 优 缺点 , 需要 权衡 利 整 后 加 以 取舍 , 也 往往 令 决 策 者 左右 为 难 。 


一 、 临 床 决策 的 模式 


























(一 ) 患者 做 主 模式 

也 称 单纯 知 照 模式 (pure informed model), 是 指 由 患者 自己 做 出 选择 。 即 医生 只 是 提供 各 种 
方案 的 利弊 等 相关 信息 , 患者 根据 自身 的 经 验 以 及 理解 独立 做 出 选择 。 在 这 里 , 患者 是 唯一 的 
决策 者 , 医生 只 提供 客观 信息 而 不 参与 决策 。 

(二 ) 医生 做 主 模式 

也 称 家 长 作风 模式 (paternalistic model), 是 由 医生 为 主导 做 出 决策 。 即 医生 单独 或 者 和 其 
他 医生 一 同 考虑 方案 的 利 凿 后 而 做 出 选择 。 在 这 种 情况 下 , 患者 不 参与 决策 , 但 前 提 是 : 假定 
医生 知道 哪 种 方案 对 患者 最 为 适合 。 
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(三 ) 共同 决策 模式 (shared decision model) 

共同 决策 模式 是 指 在 决策 过 程 中 医生 与 患者 保持 互动 共同 做 出 决策 。 这 种 模式 的 前 提 是 
言 息 充 分 对 称 , 即 医生 向 患者 提供 病情 相关 的 信息 , 包括 各 种 检查 和 可 能 的 治疗 方案 以 及 各 方 
案 的 利弊 等 情况 , 患者 则 如 实 提供 自身 的 病情 、 生 活 方式 以 及 意愿 和 价值 取向 等 信息 。 然 后 医 
患 双方 再 对 相关 的 诊治 方案 进行 讨论 , 并 结合 实际 情况 (如 社会 、 家 庭 、 医 院 技术 条 件 等 因素 ) 
以 寻求 一 个 最 优 的 诊治 方案 。 这 也 是 循 证 医学 所 倡导 的 最 佳 临 床 实践 模式 。 在 这 种 模式 下 , 医 
患 关 系 融洽 , 患者 的 意见 得 到 充分 的 尊重 。 医 患 双 方 都 是 决策 者 , 缺少 任何 一 方 , 都 是 不 完整 
决策 。 





二 、 临 床 决策 的 具体 分 型 

(一 ) 确定 型 决策 

确定 型 决策 是 指 事件 的 结局 已 经 完全 确定 的 情况 下 , 只 需 通过 分 析 各 种 方案 的 最 后 得 失 ， 
做 出 选择 。 决 策 方法 有 增 量 分 析 法 , 即 通过 计算 方案 之 间 的 增 量 收益 与 增 量 成 本 进行 决策 的 
方法 。 

(二 ) 风险 型 决策 

风险 型 决策 是 指 事件 发 生 何 种 结局 不 能 肯定 , 但 其 概率 可 以 估计 ,决策 带 有 一 定 的 风险 性 。 
风险 型 决策 有 3 个 前 提 条 件 : 即 两 种 以 上 的 结局 、 自然 状态 下 事件 的 概率 能 够 估计 、 不 同 结局 的 
利弊 可 以 估算 。 方 法 包括 期 望 值 决 策 法 、Bayes 决策 法 。 

(三 ) 不 确定 型 决策 

是 指 事件 的 结局 及 其 事件 发 生 概率 均 不 确定 的 情况 下 进行 地 决策 。 决 策 时 可 参考 一 些 准 
则 , 如 乐观 准则 、 翡 观 准则 、 后 悔 值 准则 等 , 进行 定性 判断 。 


三 、 临 床 决策 过 程 





(一 ) 明确 需 决策 的 问题 

首先 要 考虑 , 面临 的 是 什么 决策 问题 ? 要 达到 什么 目标 ? 有 哪些 备 择 方案 ? 存在 哪些 影响 
因素 ? 需要 收集 哪 方面 的 信息 , 等 等 , 总 之 , 对 涉及 该 问题 的 方方面面 要 全 面 把 握 , 为 最 终 正确 
解决 问题 打下 良好 的 基础 。 

(二 ) 决策 问题 的 组 织 和 构建 

在 选 题 的 基础 上 , 分 析 问 题 的 组 成 要 素 , 理 清 要 素 之 间 的 关联 , 预测 事态 发 展 的 趋势 ,通过 
一 些 直观 的 方法 把 各 种 方案 实施 的 进程 路径、 结局 等 形象 地 表现 出 来 , 如 常用 的 决策 树 法 。 

(三 ) 系统 全 面 搜集 信息 

决策 的 前 提 是 掌握 足够 的 决策 信息 , 这 是 决策 中 最 为 核心 的 一 步 。 应 系统 全 面 搜集 包括 各 
种 可 能 事件 的 概率 、 结 局 的 量化 指标 (生存 率 、 生 存 质量 、 成 本 等 ) 等 在 内 的 决策 信息 。 

(四 ) 决策 分 析 是 解决 问题 的 阶段 

利用 一 些 公式 或 模型 进行 分 析 和 运算 , 得 到 各 种 方案 的 期 望 值 供 决策 者 参考 。 

(五 ) 敏感 性 分 析 

鉴于 各 种 事件 的 发 生 概率 或 结局 效用 值 , 有 时 难以 确定 , 可 以 选用 不 同 的 概率 或 效用 值 重 
新 进行 分 析 和 运算 , 分 析 当 前 决策 结果 的 稳健 性 。 





二 节 ”概率 与 效用 值 的 估计 


决策 分 析 属 定量 分 析 , 需要 对 临床 问题 进行 量化 处 理 , 即 用 概率 来 定量 临床 事件 的 不 确定 
性 ,用 生存 率 、 生 存 质量 、 成 本 或 效用 值 等 来 定量 结局 。 
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一 、 概 率 的 估计 

概率 是 对 事件 结局 发 生 的 机 会 大 小 或 可 能 性 的 定量 估计 。 就 临床 问题 而 言 , 概率 可 通过 以 
下 途径 获取 : 一 是 有 针对 性 地 进行 临床 研究 , 如 开展 随机 对 照 临 床 试验 等 ; 二 是 通过 二 次 文献 
研究 , 如 系统 评价 等 方法 获得 较为 理想 的 概率 估计 。 

其 中 基线 估计 (baseline estimate ) 是 对 临床 事件 发 生 概率 或 其 他 参数 的 最 佳 估 计 。 例 如 : 急 
性 心肌 梗死 患者 的 住院 病死 率 为 10% 左右 , 在 期 自 咽 癌 患 者 的 5 年 生存 率 为 64% 左右 。 事 件 
发 生 的 概率 既 可 以 是 一 个 点 估计 值 , 也 可 以 是 一 个 区 间 估 计 , 以 区 间 最 为 常用 , 区 间 值 可 以 是 
多 个 研究 结果 的 变化 范围 , 也 可 以 是 某 个 研究 结果 的 可 信 区 间 , 区 间 范 围 越 宽 , 表明 对 事件 发 
生 概 率 估计 的 把 握 性 越 差 。 由 于 决策 相关 的 临床 数据 多 来 源 于 文献 资料 (具体 参见 本 教材 第 
五 章 ), 在 此 简 述 如 何 处 理 来 源 于 文献 资料 的 数据 , 对 于 选中 的 文献 资料 : D 若 数量 较 多 , 既 可 
取 其 结果 的 平均 值 , 也 可 确立 变化 范围 , 一 般 以 区 间 值 较为 合适 ; 或 者 , 若 研究 结果 的 同 质 性 较 
好 , 可 用 meta 分 析 , 计算 加 权 平 均值 。@ 倘 若 文献 很 少 , 有 时 仅 能 采用 一 篇 , 则 可 取 其 结果 的 可 
信 区 间 ( 如 95% C7)。 
从 文献 获取 的 临床 事件 概率 值 应 审慎 对 待 , 决策 时 应 考虑 : 研究 的 人 群 是 否 具有 同 质 性 : 
文献 中 的 人 群 特征 , 如 性 别 、 年 龄 构成 以 及 人 种 等 是 否 特殊 ; @ 干 预 的 临床 手段 是 否 相同 或 相 
近 。 这 些 都 涉及 文献 的 再 次 评价 , 尽量 采用 高 质量 文献 的 结果 , 这 对 正确 决策 至 关 重 要 。 另 外 
一 个 极端 情况 是 , 无 法 从 现成 文献 中 找到 相关 数据 , 只 能 借鉴 专家 意见 。 


二 、 效 用 值 的 估计 


这 也 是 决策 分 析 的 难点 之 一 , 由 于 对 某 种 临床 结局 的 效用 度量 存在 较 大 的 主观 性 , 不 可 如 
免 地 出 现 较 大 的 差异 。 对 不 同 结局 , 如 何 赋予 相应 的 效用 值 、 比 较真 实地 反映 结局 严重 程度 和 
患者 的 意愿 呢 ? 结局 效用 的 常用 量化 方法 有 : 画 线 法 , 博弈 法 , 时 间 权 衡 法 等 三 种 。 下 面 举例 
说 明 : 某 男性 患者 , 68 岁 , 有 糖尿 病 病史 多 年 , 现 因 意外 出 现 左 脚 刺 伤 , 出 现 严重 感染 并 可 能 出 
现 坏 外。 该 患者 面临 两 种 选择 , 一 是 截肢 , 以 保全 性 命 , 但 失去 左 脚 ; 二 是 保守 治疗 , 但 是 存在 
感染 和 坏 益 扩散 的 危险 , 从 而 有 两 种 可 能 结局 : 痊愈 或 死亡 。 

(一 ) 画 线 法 (visual analog scale) 

如 定义 死亡 的 效用 值 为 0, 健康 生存 (痊愈 ) 为 1, 介 于 0 与 1 之 间 的 则 代表 各 种 不 同 状 态 的 
效用 值 , 画 一 条 直线 如 长 10cm, 如 下 , 让 患者 在 认为 可 以 接受 的 地 方 标记 , 表示 可 以 接受 某 结 属 
所 对 应 的 效用 值 。 假 如 失去 左 脚 时 ,该 糖尿 病 患 者 在 直线 上 画 出 相应 的 效应 值 (相当 于 正常 生活 
能 力 的 质量 ) 为 0.8, 倘若 能 以 此 状态 生存 10 年 ,那么 他 的 质量 调整 寿命 年 为 10x 0.8=8 Q4LYs。 

0 1.0 

(二 ) 博弈 法 (standard gamble) 

效用 值 还 可 以 借用 决策 树 表示 ( 图 14-1), 若 告诉 患者 , 保守 治疗 的 痊愈 可 能 性 P=0.9 时 ， 
患者 可 能 会 党 不 犹 季 的 选择 保守 治疗 , 此 时 车 改变 P 值 , 当 P=0.6 时 , 患者 可 能 要 选择 截肢 。 


TO 





























失去 左 脚 (4) 








疾 愈 





图 14-1 截肢 的 决策 树 
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不 断 改变 己 值 询问 患者 , 当 达 到 某 一 数值 如 P=0.8 时 ,患者 认为 两 种 方案 差不多 , 此 时 的 卫 值 
称 为 均衡 概率 (breakeven probability ), 其 数值 就 是 结局 4 的 效用 值 . 即 U,=0.8, 意思 是 , 如 把 痉 
愈 视 为 1, 死亡 为 0, 患者 把 失去 左 脚 认 为 相当 于 0.8。 如 果 最 差 的 状态 不 是 死亡 , 而 是 一 种 较 4 
更 其 的 结局 B. 见 图 14-2。 


同样 用 上 上 述 方法 可 以 确定 4 的 效用 值 U=P+(1-P)xB, 

(三 ) 时 间 权 衡 法 (time trade-off) 

某 种 结局 (4 ) 被 认为 好 过 死亡 , 患者 面临 两 种 选择 : @ 结 局 4 生存 1 年 后 死亡 ; @ 健 康 状态 
生存 了 <7) 年 后 死亡 。 如 图 14-3 中 , 横 轴 表示 时 间 , 纵 轴 表 示 健 康 状 态 ; 不 断 变化 X. 直到 患者 
认为 两 种 选择 无 差异 时 ,此 时 结局 4 的 效用 值 VU,= Xt- 











图 14-3 终点 为 死亡 时 的 权衡 


- 段 时 间 后 恢复 健康 .那么 ,两 种 选择 是 : 暂 





如 果 患 者 最 后 不 是 死亡 , 而 是 两 种 结局 维持 - 








时 结局 4 延续 1 年 后 恢复 健康 ; @ 和 暂时 结局 BP 延续 了 年 后 恢复 健康 。 如 图 14-4 中 , 同样 不 断 变 
化 X, 直到 患者 认为 两 种 选择 无 差异 时 . 此 时 结局 4 的 效用 值 U,=1-(1-B8)Xi。 
水 
健康 1 让 
结局 4 
结局 B ! 
死亡 0 上 








图 14-4 ”终点 为 健康 时 的 权衡 


第 三 节 ”决策 树 模型 


决策 树 模 型 是 利用 决策 树 来 描述 各 种 决策 方案 在 不 同 自然 状态 下 的 收益 , 据 此 计算 各 方案 
的 期 望 收益 而 做 出 决策 。 决 策 树 (decision tree ) 按 收 辑 .时 序 把 决策 问题 中 的 备 择 方案 以 及 相应 
结局 有 机 组 织 起 来 并 用 图 形 展示 , 如 同一 棵 从 左 至 右 不 断 分 枝 的 得 ,包括 一 些 结 点 与 分 枝 : 决 
策 结 ， 点 (decision node), 用 小 方 框 表示 ， 由 此 结 点 发 出 的 六 案 要 求 决策 者 从 中 令 册 选择 ， 由 决策 
结 点 发 出 的 分 枝 岂 决策 枝 ; 机 遇 结 点 (chance node), 用 小 圆圈 表示 . 由 此 结 点 发 出 的 事件 不 受 人 
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的 意志 所 控制 , 是 随机 的 , 但 其 概率 可 以 估计 , 由 它 引 出 的 分 枝 叫 机 遇 枝 或 概率 枝 。 机 遇 节 点 
的 期 望 值 为 此 节点 下 各 分 枝 概率 ( 书 ) 与 结局 值 乘积 之 和 。 

决策 树 的 构建 原则 是 要 求 “ 简 单 且 全 面 ", 简单 是 要 求 所 建立 的 决策 树 合乎 逻辑 , 清楚 明了 ， 
这 是 从 决策 树 的 形式 方面 来 说 的 ; 全 面 则 是 要 求 决 策 树 所 反映 的 问题 充分 考虑 到 各 种 情况 , 这 
是 从 内 容 上 考虑 的 。 决 策 者 必须 要 考虑 到 每 一 种 选择 的 结局 或 者 是 后 果 有 哪些 可 能 情况 , 这 是 
形成 一 个 良好 决策 的 基础 。 

例 14-1 一 名 60 岁 男性 患者 , 职业 是 卡车 司机 , 吸烟、 肥胖 、 有 心脏 病 风险 因素 (包括 高 
血压 和 高 胆固醇 )。 因 和 患 有 严重 颈 部 疼痛 , 他 希望 医生 给 他 开 COX-2 NSAID( 非 省 体 抗 炎 药 ) 治 
疗 颈 部 疼痛 (他 听 说 这 种 药物 适用 于 颈 肩 部 疼痛 ), 但 被 拒绝 , 这 是 因为 最 新 的 证 据 表 明 COX-2 
NSAID 能 够 引发 严重 心脏 不 良 事件 。 医 生 建议 采用 颈 部 按摩 疗法 , 而 患者 又 不 接受 , 因为 他 最 
近 读 到 一 个 关于 颈 部 按摩 后 脑 卒中 瘫痪 的 报道 , 脑 卒中 瘫痪 的 风险 是 他 最 担心 的 , 此 外 , 药物 
治疗 更 方便 。 医 生 指出 , 颈 部 按摩 导致 脑 卒中 的 可 能 性 非常 小 , 心脏 病 发 作 的 危害 同样 严重 。 
医 患 双方 均 陷 人 两 难 的 困境 : 到 底 是 颈 部 按摩 治疗 (治疗 中 可 能 发 生 脑 卒 中 瘫痪 ), 还 是 COX-2 
NSAID 治疗 (服药 中 可 能 发 生 心脏 病 )。 此 时 可 以 通过 绘制 决策 树 加 以 解决 。 先 绘制 颈 部 按摩 
决策 树 (图 14-5 )。 


脑 座 中 


未 消除 颈 部 疼痛 





14-5” 颈 部 按摩 决策 树 


如 果 选 择 COX-2 NSAID 治疗 , 该 药物 虽然 有 益 于 解决 问题 , 消除 颈 部 疼痛 , 但 是 却 有 服药 
期 间 发 生 心肌 梗死 的 风险 , 选择 COX-2 NSAID 的 决策 树 见 图 14-6。 


心肌 梗死 





COX-2NSAID 





图 14-6 COX-2 NSAID 治疗 决策 树 


合并 上 述 两 种 选择 的 决策 树 见 图 14-7。 

至 此 , 决策 树 已 清楚 展示 所 要 决策 的 问题 , 下 一 步 就 是 收集 信息 并 进行 分 析 。 

本 例 决策 所 需 的 基线 估计 值 , 假设 如 下 : 颈 部 按摩 可 有 80% 的 机 会 消除 颈 部 疼痛 , 其 中 有 
1/10 的 患者 可 能 会 发 生 脑 卒 中 , 其 效用 值 为 0.45, 未 发 生 脑 卒中 患者 其 效应 值 为 1.00; 而 选择 
有 颈 部 按摩 但 未 消除 颈 部 疼痛 的 患者 , 有 1/10 可 能 会 发 生 脑 卒中 , 其 效用 值 为 0.30, 未 发 生 脑 卒 
中 的 效用 值 为 0.80。 将 这 些 估计 值 在 决策 树 中标 出 (图 14-8)。 
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脑 卒中 







棋 部 按摩 


COX-2NSAID 


图 14-7” 颈 部 按摩 与 COX-2 NSAID 治疗 的 决策 树 


脑 卒 中 


0.80 


消除 颈 部 疼痛 


COX-2NSAID 





14-8” 颈 部 按摩 与 COX-2 NSAID 治疗 的 决策 树 


本 例 中 还 应 用 了 质量 调整 寿命 年 ( O4LY) 来 衡量 结果 , 设 定 患者 无 论 是 “ 颈 部 疼痛 状态 ”下 
生存 (无 脑 洽 中 ) 还 是 有 病 生存 ( 伴 脑 洽 中 状态 ), 期 望 寿命 都 是 15 年 。 上 述 四 种 状态 的 Q4LY 
分 别 为 6.75 年 、15 年 、4.5 年 和 12 年 。 

在 此 基础 上 可 进一步 计算 各 机 遇 节点 和 各 种 方案 的 期 望 值 (expected value, EV )。 各 机 遇 结 
点 的 期 望 值 为 该 结 点 各 分 支 概率 与 结局 值 的 乘积 之 和 , 若 使 用 期 望 质量 调整 寿命 年 , 则 为 该 结 
点 各 分 支 概率 、 结 局 值 、 94LY 值 的 三 者 乘积 之 和 。 

根据 上 面 的 决策 树 可 以 计算 颈 部 按摩 治疗 的 期 望 值 (EV, ) 如 下 : 

EV11=0.45 x 0.000001+1.0x0.999999=0.99999945 

EV,,=0.30 x 0.000001+0.80 x 0.999999=0.7999995 

EVI=EVi xX0.80+EV',x0.20=0.96 
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颈 部 按摩 治疗 的 质量 调整 寿命 年 :[ (0.45 x 0.000001 )x 6.75+(1.0x0.999999)x15]x 0.80+ 
[(0.30x0.000001)x4.5+(0.80x 0.999999)x 12 ]x0.20=25.92 OALYS 

同样 可 以 计算 COX-2 NSAID 药物 治疗 的 期 望 值 EV, 和 期 望 质量 调整 寿命 年 。 

如 果 COX-2 NSAID 药物 治疗 的 期 望 值 >0.96, 或 者 质量 调整 寿命 年 >25.92 OA4LYS, 说 明 药 
物 治疗 优 于 颈 部 按摩 。 倘 若 两 个 方案 的 期 望 值 或 质量 调整 寿命 年 相差 不 大 , 医生 丽 难 以 下 定 
论 。 解 决 的 方法 是 进行 敏感 性 分 析 ( 见 本 章 第 五 节 ) 以 及 选择 合理 的 决策 模式 ( 见 本 章 第 六 节 )。 

决策 树 模型 一 般 用 于 近期 效果 的 决策 分 析 。 如 上 例 就 仅 分 析 了 绒 部 按摩 以 及 COX-2 
NSAID 治疗 期 间 的 短期 效果 。 若 要 探讨 各 种 干预 措施 的 远 期 效果 , 又 将 如 何 进行 决策 分 析 呢 ? 
如 本 例 中 即使 药物 短期 治愈 的 患者 将 来 仍 会 有 一 部 分 人 再 次 发 生 心肌 梗死 、 死 亡 , 颈 部 按摩 治 
疗 方案 同样 如 此 , 评价 这 两 种 方案 的 远 期 效果 , 可 以 选用 Markov 模型 。 
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传统 的 决策 树 方法 需要 固定 分 析 期 限 , 以 便 计算 在 此 期 间 内 各 事件 概率 和 效用 的 平均 值 。 
事实 上 疾病 发 展 是 一 个 动态 过 程 , 在 疾病 发 展 的 不 同 阶段 , 各 事件 发 生 的 概率 和 结局 的 效用 值 
是 随时 间 的 变化 而 变化 的 。 如 慢性 疾病 的 发 展 通常 可 分 无 症状 阶段 、 轻 度 不 适 阶段 .中 度 不 适 
阶段 .重症 阶段 。 如 果 能 够 从 疾病 的 发 展 阶段 人 手 并 结合 各 阶段 转换 的 概率 进行 风险 和 效益 的 
评估 , 其 结果 则 更 接近 临床 实际 , 也 更 有 说 服 力 。Markov 模型 就 是 解决 方法 之 一 。 


一 、Markov 模型 


Markov 模型 的 原理 是 将 所 研究 的 疾病 按 其 对 患者 健康 的 影响 程度 划分 为 几 个 不 同 的 健康 
状态 (Markov state ), 并 结合 各 个 状态 在 一 定时 间 内 相互 转换 的 概率 , 以 及 每 种 状态 下 的 资源 消 
耗 以 及 健康 结果 , 通过 循环 运算 , 估计 出 疾病 的 结局 以 及 医疗 成 本 。 各 个 Markov 状态 通常 按照 
临床 规律 进行 彼此 间 的 “互动 ”转换 。Markov 模型 多 用 于 : 临床 干预 措施 的 评价 , 临床 试验 结果 
的 外 推 , 药物 经 济 学 评价 和 疾病 得 查 措施 的 评价 等 。 

根据 研究 目的 和 疾病 的 转 归 , 将 疾病 的 整个 自然 过 程 划分 为 不 同 的 健康 状态 , 即 Markov 状 
态 。 各 种 状态 在 一 次 转移 后 至 下 一 次 进行 类 似 转移 的 相同 时 间 间 隔 , 称 为 Markov 周期 (Markov 








| eyele), 亦 称 转移 周期 , 常 根据 不 同 疾病 情况 和 临床 意义 而 作 具体 的 设 定 。 如 脑 卒 中 花粉 症 等 


发 生 的 频率 多 以 年 为 单位 计算 , 以 1 年 为 循环 周期 ; 如 果 文献 提供 的 是 每 年 的 发 病 率 、 死 亡 率 或 
致 残 率 等 , 则 循环 周期 设置 为 1 年 。 

以 肾病 综合 征 为 例 , 可 分 为 以 下 五 个 阶段 : 正常 状态 ,微量 蛋白 尿 期 , 大 量 蛋 白 尿 期 , 终 末 
期 肾病 , 死亡 (图 14-9 )。 

对 疾病 进程 的 风险 描述 通常 是 按 单位 时 间 ( 一 般 是 一 个 Markov 周期 ) 进 行 的。 如 : 处 于 微 
量 蛋 白 尿 期 的 患者 每 年 有 5% 进展 到 大 量 蛋白 尿 阶段 , 循环 周期 为 1 年 。 





图 14-9 ”肾病 综合 征 的 Markov 状态 转移 模型 
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二 、Markov 模型 的 分 析 步 又 


与 决策 树 模型 类 似 , Markov 模型 也 可 以 分 为 以 下 几 步 : 

(一 ) Markov 状态 的 设 定 

将 临床 问题 进行 分 解 , 根据 研究 目的 确定 各 种 疾病 的 状态 , 从 而 设 定 相关 的 Markov 状态 。 
对 各 种 疾病 状态 的 逻辑 表现 形式 , 可 以 借助 Markov 树 (Markov tree) 来 表达 。 各 种 状态 之 间 的 转 
换 必须 符合 逻辑 和 临床 实际 。 

(二 ) 基础 信息 的 搜集 

即 各 种 状态 之 间 转 换 概 率 以 及 循环 周期 的 确定 。 主 要 是 从 文献 中 获得 , 通常 用 矩阵 按照 事 
件 发 生 的 逻辑 顺序 列 出 来 , 如 上 述 的 肾病 综合 征 的 几 个 状态 : 正常 状态 (状态 1), 微量 蛋白 尿 阶 
段 ( 状 态 2), 大 量 和 蛋白 尿 阶段 (状态 3), 终 末 期 肾病 (状态 4), 死亡 ( 状 态 5)( 表 14-1)。 

表 14-1 各 种 疾病 状态 1 年 的 转移 概率 
正常 状态 微量 蛋白 尿 阶段 。 大 量 蛋 白 尿 阶 段 。” 终 末 期 肾病 交 亡 








正常 状态 0.97 0.02 0.01 
微量 蛋白 尿 阶 段 0.94 0.04 0.02 
大 量 和 蛋白 尿 阶段 0.90 0.05 0.05 
终 末 期 肾病 0.80 0.20 











假设 肾病 综合 征 自然 状态 从 第 1 年 开始 , 一 个 健康 人 群 中 (状态 1), 每 年 有 2% 的 人 进入 状 
态 2, 1% 的 人 进入 状态 5; 而 处 于 状态 2 的 人 中 每 年 有 4% 的 人 进入 状态 3,2% 的 人 进入 状态 5; 
处 于 状态 3 的 人 群 有 5% 的 人 进入 状态 4, 5% 的 人 进入 状态 5; 处 于 状态 4 的 人 每 年 有 20% 的 
人 进入 状态 5( 死 亡 )。 

(三 ) 各 种 状态 效用 值 的 确定 

如 例 14-2、 例 14-3。 

(四 ) Markov 模型 的 综合 分 析 

如 例 14-2、 例 14-3。 

(五 ) 敏感 性 分 析 

同 决策 树 模型 一 样 , Markov 模型 也 应 进行 敏感 性 分 析 , 以 判断 分 析 结果 的 稳健 性 。 

例 14-2 ”假设 某 种 疾病 只 有 3 个 状态 : 健康 (状态 1)、 患 病 (状态 2)、 死 亡 ( 状 态 3), 其 转移 
概率 列 于 表 14-2。 


表 14-2 3 种 状态 1 年 的 转移 概率 








健康 患 病 死亡 
健康 0.75 0.20 0.05 
患 病 0 0.70 0.30 
死亡 0 0 





其 意义 亦 可 示意 如 图 14-10: 





图 14-10 三 种 状态 的 转移 关系 及 概率 
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设 定 3 种 状态 的 效用 值 分 别 如 下 : 健康 为 1, 患 病状 态 为 0.5, 死亡 为 0。 构建 Markov 树 


| (图 14-11)。 


健康 





图 14-11 三 种 状态 的 Markov 树 


假设 有 1000 名 符合 相关 条 件 的 健康 人 群 , 从 某 一 时 间 点 开始 , 依次 进入 这 3 种 状态 , 据 此 
计算 出 这 一 人 群 此 后 每 年 在 这 3 个 状态 中 的 分 布 情况 , 进而 计算 每 一 循环 周期 或 者 是 至 研究 结 
束 时 所 有 周期 累计 的 资源 耗费 或 各 种 结局 的 具体 情况 。 

首先 假设 :为 周期 (年 ), a, 表示 第 :年 (周期 ) 时 的 “健康 ”人 数 , b, 表示 第 :年 时 的 处 于 患 病 
状态 的 人 数 , c, 表示 第 :年 时 总 的 死亡 人 数 。 计 算 如 下 : ao=1000, jpo=0,co=0;a=0.75xao， 
b1=0.20x aot+0.70x bo, c=co+0.30x bo+0.05 x ao; 依 此 类 推 :wa=0.75xao, 包 =0.20xal 证 0.70x 
bs C=C(1j+0.30x bij+0.05 x a 如 表 14-3 所 示 : 


表 14-3 ”Markov 模型 模拟 的 计算 结果 








周期 (1) ”健康 (a) ” 患 病状 态 (b,) xt(0) | 周期 (1) ”健康 (a,) ” 患 病 状态 (b.) ”死亡 (ci) 
0 1000 0 0 六 133 205 662 
1 750 200 50 8 100 170 530 
2 560 290 150 9 75 139 786 
3 420 315 265 10 56 113 831 
4 316 305 379 20 3 9 988 
5 237 277 486 25 . 3 996 
6 178 241 581 28 0 0 1000 











进一步 计算 每 一 个 循环 末 的 结局 ,如 第 1 个 周期 未 的 总 质量 调整 寿命 年 (OA4LY) 为 : 750 x 
1+200x0.5+50x0=850 QO4LYs, 依次 计算 可 以 获得 该 模型 模拟 28 年 的 总 质量 调整 寿命 年 为 
5332.7 QALYs, 而 人 均 质量 调整 寿命 年 为 533 OA4LYs。 这 是 自然 状态 下 未 加 干预 手段 的 结果 ， 
如 果 对 该 侣 施加 一 定 的 临床 干预 , 则 必然 影响 人 群 在 不 同 状态 下 的 分 布 , 就 可 计算 在 该 干预 
措施 下 的 人 均 04LYs, 如 果 有 多 个 干预 措施 , 同样 可 以 计算 不 同 措施 下 的 @4LYs, 从 而 可 以 比 
较 不 同 干预 措施 的 效果 。 

临床 干预 措 施 既 可 影响 患者 在 不 同 疾病 状态 的 分 布 , 也 可 影响 各 状态 间 的 转换 概率 , 此 时 
可 用 Markov 模型 评价 不 同 干预 措施 下 的 期 望 值 , 据 此 选择 适当 的 干预 手段 ,同时 也 可 结合 资源 
消耗 估计 , 进行 成 本 -效益 分 析 等 。 

例 14-3 ” 某 50 岁 男性 患者 , 体检 发 现 左 颈 动脉 硬化 , 但 目前 没有 任何 临床 症状 ， 对 于 该 串 
者 的 治疗 , 若 不 处 理 则 有 较 高 的 发 生 脑 卒中 的 风险 , 鉴于 目前 无 任何 症状 , 临床 上 可 以 有 两 种 
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选择 , 一 是 暂时 临床 观察 , 二 是 行 颈 动脉 内 膜 切除 术 。 若 只 进行 临床 观察 , 虽 可 避免 手术 相关 
的 短期 危险 因素 ( 围 手 术 期 死亡 , 手术 中 发 生 脑 卒 中 ), 维持 无 症状 性 颈 动脉 硬化 状态 (在 一 段 特 
定时 间 内 不 发 生 脑 卒中 ), 但 面临 将 来 发 生 脑 卒中 的 高 风险 。 假 设 本 例 的 基础 估计 值 如 下 : 选择 
临床 观察 的 患者 有 11% 的 可 能 发 生 脑 卒中 , 而 选择 做 手术 者 有 1% 的 围 手术 期 死亡 ,以 及 有 2% 
发 生 围 手术 期 脑 座 中 , 术 后 “不 发 生 脑 卒中 ” 者 将 可 能 有 5% 再 次 发 生 脑 卒中 。 

如 图 14-12 所 示 , 术 后 患者 有 三 种 结局 , 即 维持 无 症状 性 有 颈 动 脉 硬化 状态 、 发 生 脑 卒中 和 死 
亡 。 同 时 随 着 时 间 的 推移 , 无 症状 性 颈 动脉 硬化 状态 的 患者 将 会 有 一 部 分 人 死亡 , 一 部 分 发 生 
脑 卒 中 , 余下 的 人 维持 无 证 状 性 颈 动 脉 硬化 状态 。 对 于 带 病 生 存 ( 伴 有 脑 卒中 ) 者 , 也 会 随 着 时 | 
间 推 移 , 部 分 人 会 死亡 , 而 生存 者 继续 这 种 循环 , 直至 所 有 人 都 死亡 。 | 











状态 Markov 循 环 状态 
A 4 脑 卒中 


不 发 生 脑 卒中 











不 发 生 脑 卒中 


图 14-12 ” 颈 动脉 硬化 患者 的 Markov 模型 示意 图 (Markov 树 ) 


用 Markov 模型 来 模拟 他 们 的 结局 , 并 同 其 他 的 方案 进行 比较 后 做 出 选择 。 本 例 有 三 个 
Markov 状态 : 无 症状 性 颈 动脉 硬化 (状态 1), 伴 脑 卒中 生存 (状态 2), 死亡 (状态 3)。 其 中 状态 1 
到 状态 3 的 死亡 率 为 5%, 并 不 完全 归结 于 颈 动脉 硬化 这 一 疾病 所 致 (要 尽 可 能 模拟 实际 情况 ， 
考虑 有 其 他 死亡 原因 )。 它 们 之 间 的 转换 关系 及 转移 概率 见 表 14-4 和 图 14-13。 








表 14-4 3 种 自然 状态 每 年 的 转移 概率 








无 症状 性 颈 动脉 硬化 生存 ( 伴 脑 卒中 } 死亡 
无 症状 性 颈 动 脉 硬化 0.9405 0.0095 0.05 
生存 ( 伴 脑 卒中 ) 0 0.95 0.05 





0.9405 


0.95 


伴 脑 卒中 生存 0 
| 


14-13” 颈 动脉 硬化 患者 各 状态 间 的 转移 关系 
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取 Markov 循环 周期 为 1 年 ,那么 每 一 个 周期 “无 症状 性 颈 动脉 硬化 "为 1 个 Q4LY, 伴 脑 卒 
中 生存 则 为 0.5 个 04LY, 死亡 则 为 0。 假设 从 手术 当年 起 , 维持 无 症状 性 颈 动 脉 硬化 占 97% 
伴 脑 卒中 生存 的 占 2%, 死亡 为 1%。 此 后 人 群 在 这 3 个 状态 的 转移 概率 见 表 14-4。 

计算 原理 同上 , 鉴于 这 一 过 程 的 计算 比较 麻烦 , 可 以 借助 相关 软件 进行 , 如 decision maker， 
treeage 等 , 比较 简单 的 计算 也 可 运用 Excel, 如 本 例 计 算 结 果 见 表 14-5, 对 该 人 群 而 言 , 选择 手 
术 治 疗 , 其 最 终结 果 是 人 均 获 得 16 个 O04LYs。 同 理 , 计算 选择 “临床 观察 "方案 的 人 均 O4ZY， 
数值 较 大 者 的 方案 为 优选 方案 。 


表 14-5 “手术 决策 枝 的 Markov 模型 计算 结果 








无 症状 性 颈 动 脉 硬化 生存 ( 伴 脑 卒 中 ) 死亡 本 
例 数 QALY 例 数 QALY 例 数 ” QALY 
， 97 000 2000 1000 
2 91228 91228 2822 1411 5950 0 92639 92 639 
3 85800 85 800 3548 1774 10652 0 87574 180213 
4 80695 80695 4786 2093 15119 0 82788 263 001 
5 75 893 75 893 4744 2372 19363 0 78265 341266 
6 71377 71377 5228 2614 23395 0 73991 415 257 
3 67 130 67130 5645 2822.5 27225 0 69 953 485210 
8 63 136 63 136 6001 3000.5 30863 0 99 137 551347 
9 59379 59397 6301 3150.5 34320 0 62530 613 887 
10 55 846 55 846 6550 3275 37604 0 59121 672 998 
11 55 523 52 523 6754 3377 40723 0 55 900 728 898 
50 0 0 0 0 10000 0 0 1599 600 
合计 1599 600 
人 均 16.00 








注 : @ 无 症状 性 颈 动 脉 硬化 状态 效用 值 =1, 生存 ( 伴 脑 卒中 ) 效 用 值 =0.5, 死亡 效 用 值 =0; 4LY: 质量 调整 寿命 年 
@ 本 例 数据 引 自 文献 : Birkmeyer JD, Liu JY. Decision analysis models: Opening the black box [J]. Surgery, 2003, 133(1): 1-4 





当然 , 如 果 对 来 源 基础 数据 的 可 靠 性 存在 疑问 , 同样 可 以 进行 敏感 性 分 析 , 以 了 解 当前 决 
策 的 稳健 性 如 何 。 


第 五 节 ”敏感 性 分 析 


在 第 四 节 中 提 到 , 如 果 认 为 选择 做 手术 的 死亡 率 (1%) 过 高 或 是 过 低 ,或 者 1% 概率 估计 不 
准确 , 抑或 不 固定 ,是 一 个 区 间 值 , 手术 死亡 率 不 同 ,将 影响 到 最 终 的 决策 。 此 时 可 考虑 进行 敏 
感性 分 析 。 

当 相关 数值 变化 时 , 敏感 性 分 析 可 用 来 判断 决策 结果 的 稳健 性 。 这 里 就 对 第 四 节 中 的 例 
14-3 进行 敏感 性 分 析 , 当 取 不 同 的 手术 死亡 率 时 ,分 别 计算 出 不 同 的 手术 治疗 方案 的 期 望 值 ， 
图 14-14 显示 的 就 是 当 手 术 死亡 率 在 一 定 范围 内 变动 时 、 期 望 值 相应 变化 情况 。 从 图 中 可 以 看 
出 , 当 手 术 死亡 率 为 2.1% 时 , 两 种 方案 的 期 望 值 相当 , 此 时 的 2.1% 称 为 闵 值 , 代表 两 种 方案 选 
择 的 分 界 点 。 当 手术 死亡 率 在 小 于 2.1% 的 区 间 变 化 内 , 选择 手术 方案 是 合适 的 。 

再 如 , 对 伴 有 脑 卒中 生存 状态 的 效用 值 也 存在 疑惑 , 同样 可 以 进行 阐 值 分 析 和 敏感 性 分 析 
(图 14-15)。 
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期 望 值 


一 9 一 手术 
一 一 A 一 一 临床 观察 


0.02 0.025 0.03 


期 望 值 


效用 值 
图 14-15 对 伴 脑 卒中 生存 效用 值 的 敏感 性 分 析 


实际 上 对 事件 结局 及 其 发 生 概率 都 可 以 进行 敏感 性 分 析 。 决 策 树 模型 如 此 , Markov 模型 也 
同样 可 以 进行 敏感 性 分 析 , 计算 出 相关 的 阔 值 , 方法 同上 。 


第 六 节 ”不 确定 型 决策 


假如 临床 事件 结局 及 其 发 生 概率 明确 并 可 量化 , 可 选择 决策 树 模型 或 Markov 模型 进行 决 
策 分 析 。 但 倘若 有 些 临床 事件 结局 及 其 概率 不 清楚 且 无 最 佳 证 据 可 循 时 , 只 能 进行 不 确定 型 决 
策 , 即 依赖 于 决策 者 的 临床 经 验 和 主观 判断 进行 决策 。 以 下 准则 可 供 决策 者 参考 : 

(一 ) 乐观 准则 

也 称 大 中 取 大 法 , 即 找 出 每 种 方案 自然 状态 下 的 最 大 收益 者 , 从 中 再 取 最 大 者 。 

(二 ) 悲观 准则 

也 称 小 中 取 大 法 , 即 先 找 出 每 种 方案 自然 状态 下 的 最 小 收益 者 , 从 中 再 取 最 大 者 。 

(三 ) 后 悔 值 准则 

计算 各 方案 在 各 种 自然 状态 下 的 后 悔 值 并 列 出 后 悔 值 表 , 找 出 每 一 方案 在 各 种 自然 状态 下 
后 悔 值 的 最 大 者 , 从 中 再 取 最 小 者 所 对 应 的 方案 , 即 为 合理 方案 。 后 悔 值 法 利用 后 悔 值 的 计算 
作为 最 优 方案 选择 标准 。 先 将 在 不 同 自然 状态 下 的 最 大 收益 值 作为 理想 目标 , 再 把 各 方案 的 收 
益 值 与 这 个 最 大 收益 值 的 差 值 , 作为 未 达到 理想 目标 的 后 悔 值 , 然后 从 各 方案 最 大 后 悔 值 中 取 
最 小 者 , 由 此 确定 选择 方案 。 

例 14-4” 鼻 咽 癌 以 放射 治疗 为 主 ,对 于 颈 部 有 淋巴 结 转移 的 患者 , 颈 部 应 给 予 根治 量 照 射 ， 
而 颈 部 没有 淋巴 结 转移 者 , 常规 给 予 预防 剂量 照射 ,但 有 人 也 提出 如 鼻 咽 肿瘤 不 大 , 可 不 对 肛 
部 进行 放射 治疗 。 因 此 , 对 于 颈 部 未 发 现 有 淋巴 结 转移 的 患者 , 是 否 给 予 放射 治疗 或 给 予 什么 
剂量 , 目前 仍 有 争论 。 假 如 有 一 鼻 咽 癌 患 者 , 经 临床 检查 未 发 现 颈 部 淋巴 结 转移 和 远 处 转移 ， 
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MR 显示 颈 部 有 两 个 最 大 径 小 于 10mm 的 淋巴 结 , 临床 分 期 仍 为 TNoMo。 但 不 清楚 患者 颈 部 是 
和 否 存在 微小 转移 灶 , 对 该 患者 颈 部 是 实施 根治 量 照射 还 是 预防 量 照射 ,抑或 不 必 进 行 放射 治疗 ， 
需要 临床 决策 。 倘 若 颈 部 检查 虽 未 发 现 淋 巴结 转移 、 但 实际 已 有 转移 , 如 果 不 对 颈 部 放疗 或 者 
只 是 给 予 预防 剂量 , 显然 不 恰当 , 但 这 种 情况 发 生 的 概率 并 不 清楚 。 另 一 方面 , 倘若 都 采取 根 
治 量 照射 , 由 于 颈 部 放射 后 的 纤维 化 等 后 遗 症 比较 严重 , 将 极 大 影响 患者 的 生存 质量 , 特别 是 
对 颈 部 并 无 淋巴 结 转移 的 患者 , 次 远大 于 利 。 

由 于 缺乏 以 上 事件 的 确切 概率 , 只 能 采取 不 确定 型 决策 。 对 于 癌症 治疗 的 评价 , 主要 是 使 
患者 的 损失 最 小 , 其 结局 可 用 “效用 损失 ” 衡量。 效用 值 的 确定 在 这 里 需要 考虑 的 有 : @ 颈 部 淋 
巴结 复发 或 远 处 转移 的 影响 ; @ 放 疗 后 遗 症 对 生存 质量 影响 的 程度 ; @@ 治 疗 费用 ; @ 患 者 对 治 
疗 的 期 望 值 以 及 放射 治疗 的 了 解 等 情况 。 同 时 也 应 考虑 到 : 不 同年 龄 、. 职业、 社会 地 位 的 患者 ， 
其 效用 值 损失 的 估计 也 不 尽 相 同 。 这 时 的 决策 应 尽量 做 到 个 体 化 。 

表 14-6 中 为 几 种 结局 的 效用 损失 的 定量 估计 : 无 淋巴 结 转移 也 不 对 颈 部 进行 放疗 的 效用 
损失 为 0, 有 颈 部 淋巴 结 转移 而 未 进行 放射 治疗 的 效用 损失 为 -100, 有 颈 部 淋巴 结 转移 而 只 进 
行 预防 剂量 放射 治疗 的 效用 损失 为 -30, 无 颈 部 转移 而 行 预防 剂量 放射 治疗 的 效用 损失 为 -50， 
有 绒 部 转移 而 行 根 治 剂量 放射 治疗 的 效用 损失 为 -20, 无 颈 部 转移 而 行 根 治 剂量 放射 治疗 的 效 
用 损失 为 -80。 








表 14-6 鼻 咽 癌 患 者 三 种 治疗 方案 的 效用 值 











不 放疗 预防 剂量 放疗 治 剂量 放疗 
有 有 颂 部 转移 —100 —30 “20 
无 颈 部 转移 0 -50 —80 














由 于 不 知道 颈 部 淋巴 结 转移 的 概率 , 面 对 这 一 不 确定 性 , 依照 前 面 提 到 的 几 种 准则 进行 
决策 : 

1. 乐观 准则 在 每 一 备 择 方案 中 , 找 出 各 种 结局 下 的 最 大 受益 值 , 从 中 选择 收益 值 最 大 的 
方案 ,也 就 是 从 最 大 收益 中 取 最 大 。 本 例 中 不 放疗 的 最 大 收益 为 0, 预防 剂量 放疗 为 -30, 根治 
剂量 放疗 为 -20。 按 照 这 一 原则 , 应 该 选择 不 放疗 , 这 是 一 种 相对 乐观 的 准则 。 

2. 翡 观 准则 与 乐观 者 相反 , 找 出 各 种 结局 下 的 最 小 收益 值 , 再 从 中 选择 收益 值 最 大 的 方 
案 , 也 就 是 从 最 小 收益 值 中 取 最 大 。 本 例 中 不 放疗 的 最 小 收益 为 -100, 预防 剂量 放疗 为 -50， 
根治 剂量 放疗 为 -80。 最 大 者 为 -50, 应 选择 预防 剂量 放疗 。 

3. 后 悔 值 准则 ”按照 这 一 准则 , 两 种 自然 状态 下 的 理想 值 在 有 颈 部 转移 时 为 -20, 无 颈 部 
转移 为 0, 可 以 计算 各 状态 下 的 后 悔 值 , 具体 表 14-7 的 后 悔 值 矩 阵 





表 14-7 后悔 值 和 矩阵 











治疗 方案 自然 状态 最 大 后 悔 值 
有 淋巴 结 转移 无 淋巴 结 转移 (各 方案 ) 
不 放疗 80[(-20)-(-100)] 0(0, 理想 值 ) 80 
预防 剂量 放疗 10[(-20)-(-30)] 50[0-(-50)] 50 
根治 剂量 放疗 0(-20, 理想 值 ) 80[0-(-80)] 80 





可 见 在 这 一 准则 下 应 该 选择 预防 剂量 的 放射 治疗 这 一 方案 。 

应 该 注意 到 , 由 于 缺乏 准确 信息 ,利用 上 述 决策 准则 时 ,往往 带 有 很 大 的 主观 性 。 因 此 , 决 
策 准 则 及 决策 者 不 同 , 所 得 到 的 结果 也 不 完全 相同 。 当 然 , 最 好 还 是 收集 资料 信息 , 尽量 获得 
各 种 结局 的 概率 , 以 改进 不 确定 型 决策 , 从 而 使 选择 的 方案 更 趋 合理 。 





第 十 四 章 决策 分 析 


第 七 节 ”决策 分 析 的 局 限 性 


决策 分 析 作为 一 种 以 证 据 为 基础 的 临床 应 用 技术 , 已 开始 逐步 应 用 于 临床 实践 中 。 但 应 注 
意 , 决策 分 析 也 存在 一 定 的 局 限 性 , 并 不 能 保证 每 次 都 能 作出 正确 的 选择 。 以 下 几 方面 均 可 能 
影响 决策 结果 : 

首先 ,决策 正确 与 否 在 很 大 程度 上 取决 于 数据 是 否 充分 、 准 确 。 对 于 决策 分 析 所 必需 的 基 
线 数 据 , 如 事件 概率 和 效用 值 , 目前 往往 缺乏 高 质量 的 临床 试验 的 结果 , 内 部 和 外 部 偏 傈 会 影 
响 数据 的 准确 性 , 由 此 可 能 造成 决策 失误 。 

其 次 , 再 复杂 的 决策 模型 也 不 能 完全 模拟 临床 实际 , 只 是 临床 实际 的 简化 版 。 患 者 病程 进 
展 往往 复杂 而 变化 无 常 , 决策 者 必须 考虑 临床 问题 的 方方面面 , 包括 治疗 方案 、 不 良 反应 、 成 
本 , 以 及 患者 的 个 体 差异 、 特 殊 要求 等 , 决策 中 的 影响 因素 之 多 远 非 一 般 决 策 树 所 能 描绘 。 

最 后 , 对 决策 分 析 的 结果 需 慎重 解释 。 决 策 分 析 的 期 望 值 为 0.96, 并 不 能 保证 每 个 患者 的 
实际 效应 值 等 于 0.96。 它 只 是 一 个 平均 水 平 , 即 一 组 病情 程度 相似 的 患者 , 若 选择 颈 部 按摩 后 ， 
其 平均 效应 值 为 0.96。 因 此 , 在 临床 实践 中 , 应 审视 你 的 患者 与 决策 分 析 中 的 研究 对 象 之 间 的 
相似 性 , 也 可 借助 敏感 性 分 析 , 为 个 体 患者 选择 最 恰当 的 治疗 方案 。 

尽管 如 此 , 临床 决策 分 析 仍 不 失 为 一 种 有 价值 的 临床 实践 工具 , 同时 通过 识别 哪些 变量 ( 概 
率 、 效 用 值 ) 是 影响 决策 的 敏感 因素 , 决策 分 析 也 为 下 一 步 研究 指明 方向 。 

( 杜 进 林 “ 华 贻 军 ” 洪 明 晃 ) 
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循 证 实践 共 五 个 步 又 ,其 前 四 步 , 即 提出 问题 寻找 证 据 、 严 格 评价 证 据 和 应 用 证 据 于 临床 
和 预防 实践, 循 证 实践 的 第 五 个 步骤 亦 就 是 循 证 医学 自我 评价 ,是 对 循 证 医学 实践 过 程 的 评价 ， 
评价 贯穿 于 循 证 实践 的 每 一 个 过 程 。 在 循 证 医学 实践 过 程 中 , 发 挥 主导 作用 的 是 临床 医生 , 屠 
么 医生 有 没有 能 力 实践 循 证 医学 需要 评价 。 同 时 实践 循 证 医学 所 达到 的 效果 如 何 也 应 评价 。 
循 证 医学 自我 评价 的 方式 有 自我 评价 和 同行 评价 。 由 于 本 教材 的 对 象 是 医学 生 , 是 未 来 的 医 
生 , 因此 ,本章 主 要 针对 循 证 自我 设计 、 行 动 及 效果 的 评价 。 下 面 将 分 步骤 对 需 进行 自我 评价 
的 部 分 进行 详细 介绍 。 

评价 循 证 医学 在 某 个 地 区 、 区 域 或 国家 的 应 用 状况 是 卫生 行政 管理 者 、 决 策 者 所 关注 的 内 
容 ,本 章 将 不 作 讨论 。 





第 一 节 能 力 评 价 


一 、 评 价 “提出 可 回答 问题 ”的 能 力 

“提出 可 回答 问题 " 是 循 证 医学 实践 的 第 一 步 , 若 问题 提出 的 不 恰当 , 循 证 医学 的 后 续 实施 
步骤 均 会 受到 影响 。 表 15-1 列 出 了 5 个 有 关 “提出 可 回答 问题 "能力 的 自我 评价 问题 。 首 先是 
有 没有 提出 问题 ? 车 没有 提出 问题 , 就 根本 谈 不 上 实践 循 证 医学 。 其 次 , 提出 的 问题 其 陈述 是 
否 简洁 明了 , 符合 格式 ?有关 背 景 问题 的 两 个 基本 成 分 和 核心 问题 的 三 到 四 个 成 分 是 否 准确 明 
了 。 接 下 来 的 问题 是 , 在 积累 了 一 定 的 经 验 之 后 , 可 否 进一步 明确 主要 问题 所 在 , 明确 自己 还 
欠缺 哪些 知识 , 并 对 最 初 提出 的 问题 进行 修改 ” 另 一 个 问题 是 提出 问题 的 过 程 中 若 遇 到 障碍 ， 
能 否 想 办 法 有 能 力克 服 之 ”最 后 一 个 问题 是 医疗 实践 过 程 中 随时 可 能 产生 新 的 问题 , 有 没有 
养 成 随时 记录 问题 以 待 今后 解决 的 习惯 ? 是 否 将 提出 问题 融入 每 天 的 临床 活动 中 。 记 录 问 题 
的 方法 有 多 种 , 有 沿用 至 今 的 传统 方式 如 随身 携带 记事 本 , 也 有 科技 发 展 提供 的 高 科技 手段 如 
PDA(personal digital assistant, 掌上 电脑 )。 另 外 ， 随 着 循 证 医学 实践 活动 的 增加 , 可 查看 “提出 
可 回答 问题 "的 成 功率 是 否 在 提高 , 据 此 , 可 分 析 判 断 提 出 问题 的 能 力 是 否 在 提升 。 




















表 15-1 对 “提出 可 回答 问题 ”的 自我 评价 








条 目 具体 问题 
1 有 没有 提出 临床 问题 ? 
多 问题 的 陈述 是 否 简 洁 明了 , 符合 一 定 的 格式 ? 
2a 有 关 “ 背 景 " 知识 的 两 个 基本 成 分 
2b 有 关 诊 断 .治疗 、 管 理 等 “核心 "知识 的 三 (或 四 ) 部 分 
3 有 没有 借助 绘图 法 来 明确 自己 还 欠缺 哪些 知识 , 并 对 最 初 提出 问题 进行 修改 ? 
4 提出 问题 的 过 程 中 若 遇 见 障碍 , 能 否 想 办 法 克服 ? 
5 有 没有 养 成 随时 记录 问题 以 待 今后 解决 的 习惯 ? 





-评价 “ 导 找 最 佳 外 部 证 据 ” 的 能 力 
对 “寻找 最 佳 外 部 证 据 " 的 能 力 可 根据 表 15-2 中 所 列 条 目 进行 自我 评价 。 首 先是 有 没有 去 
222 
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寻找 证 据 ? 其 次 , 是 否 了 解 本 领域 内 现 有 的 最 佳 临床 证 据 来 源 ? 若 不 知道 最 佳 证 据 的 来 源 , 则 
很 难 能 找 到 最 佳 证 据 。 同 时 是 否 能 以 找到 最 高 级 别 证 据 为 检索 目的 , 并 力求 找到 位 于 “信息 金 
字 塔 "顶端 的 证 据 ( 图 6-1)? 第 三 点 是 能 不 能 迅速 寻找 到 临床 实践 所 需 的 硬件 、 软 件 及 最 佳 证 
据 ? 从 事 循 证 实践 人 员 、 医 院 和 相关 其 他 机 构 是 否 将 硬件 、 软 件 等 资源 合理 配置 ? 是 否 突出 标 
记 了 最 重要 的 证 据 来 源 ? 按照 研究 步骤 如 : 确定 资源 、 启 动 资源 、 键 和 人 问题 、 获 得 答案 等 进行 时 
间 分 配 时 , 可 通过 提高 哪些 环节 的 效率 进而 提高 研究 的 整体 效率 ? 如 果 是 独立 开展 研究 , 能 否 
从 庞杂 的 信息 来 源 中 寻找 到 最 佳 外 部 证 据 ? 研究 能 和 否 更 具 效率 ? 检索 MEDLINE 数据 库 时 是 否 

关 主 题词 表 ( MeSH )、 限 制 词 以 及 智能 检索 (intelligent free text ) 等 检索 技巧 ”是否 设置 
了 有 效 的 检索 过 滤器 ? 





表 15-2 对 “寻找 最 佳 外 部 证 据 " 的 自我 评价 

条 目 具体 问题 

1 有 没有 寻找 证 据 ? 

2 是 否 了 解 本 领域 内 现 有 的 最 佳 临床 证 据 来 源 ? 

e 能 否 迅 速 寻找 到 临床 实践 所 需 的 硬件 、 软 件 及 最 佳 证 据 ? 
4 能 否 从 庞杂 的 信息 来 源 中 寻找 到 有 用 的 外 部 证 据 ? 
5 
6 





在 寻找 证 据 的 实战 过 程 中 有 没有 逐步 提高 检索 的 效率 ? 
在 MEDLINE 数据 库 中 检索 时 有 没有 使 用 截断 、 布 尔 逻辑 算 符 (or 等 ) MeSH 主题 词 、 限 制 
词 及 智能 检索 等 检索 技巧 ? 

7 与 专业 文献 检索 人 员 以 及 热衷 提供 最 佳 证 据 并 受 人 们 尊敬 的 同行 检索 结果 相 比 , 我 们 自己 
的 检索 结果 如 何 ? 








评价 “寻找 最 佳 外 部 证 据 " 能力 的 另 一 个 可 行 的 方法 是 : 请 文献 检索 专业 人 员 或 其 他 专业 
人 士 对 同一 个 问题 进行 重复 检索 , 然后 与 我 们 的 检索 结果 进行 对 比 , 比较 两 次 检索 在 检索 策 
略 、 检 索 结果 、 文 献 相关 性 及 可 用 性 等 方面 的 差异 。 这 样 做 有 三 个 益处 : 一 是 能 够 完成 自我 评 
价 ; 二 是 能 从 中 学 到 更 好 的 检索 技巧 ; 第 三 点 是 能 够 获得 更 多 的 、 可 以 回答 临床 问题 的 外 部 
证 据 。 

除 上 述 两 种 方法 之 外 , 还 可 以 与 附近 的 医学 图 书馆 取得 联系 ,参加 他 们 举办 的 课程 (如 医学 
文献 检索 ) 或 是 索取 有 关 的 指南 以 便 从 中 自我 学 习 , 达到 实践 循 证 医学 所 需要 的 文献 检索 能 力 。 
甚至 还 可 以 邀请 文献 管理 员 加 入 我 们 的 研究 团队 ,会 更 好 地 提高 检索 水 平和 检索 效率 。 与 循 证 
医学 有 关 的 专业 检索 培训 也 可 以 有 效 提高 文献 的 检索 能 力 。 

三 、 评 估 “ 严 格 评价 证 据 质量 ”的 能 力 

该 项 能 力 的 评估 可 参照 表 15-3 中 的 条 目 。 首 先是 否 对 收集 到 的 临床 外 部 证 据 进行 了 质量 
评估 ? 如 果 回 答 是 否定 的 ,那么 原因 是 什么 ”能 否 找到 并 克服 妨碍 我 们 对 临床 外 部 证 据 进行 质 
量 评估 的 障碍 ”目前 , 在 加 拿 大 、 美 国 等 一 些 发 达 国家 ,临床 医生 若 能 加 入 某 个 小 组 (如 各 种 杂 
志 俱 乐 部 ) 中 , 不 但 能 有 助 于 循 证 医学 实践 , 同时 还 能 及 时 获得 循 证 实践 的 反馈 意见 。 

表 15-3 对 "严格 评价 证 据 质量 "的 自我 评价 
条 目 具体 问题 
是 天 对 外 部 证 据 进行 了 严格 评估 ? 
严格 评估 证 据 的 指南 是 否 易于 使 用 ? 
能 香 逐 渐 做 到 准确 且 熟 练 地 使 用 某 些 严格 评估 的 指标 , 如 似 然 比 、NNT 等 ? 
有 没有 创建 任何 严格 评价 证 据 的 题目 (CAT), 对 严格 评估 进行 总 结 ? 








人 mm PP 一 
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一 旦 开始 评价 , 应 考虑 是 否 这 些 评估 证 据 的 指南 是 否 容易 应 用 。 许 多 临床 医生 发 现 , 随 着 
时 间 的 推移 , 他 们 能 够 从 容 评 价 大 多 数 证 据 , 但 总 有 那么 一 两 篇 文献 难以 定论 。 这 种 情况 在 由 
临床 医生 组 成 的 专业 小 组 中 也 常会 出 现 , 但 对 于 专业 小 组 , 问题 提出 的 快 , 解决 的 速度 也 比较 
快 。 进 一 步 需 要 考虑 的 是 在 严格 质量 评估 时 ,对 某 些 效应 指标 (如 似 然 比 、NNT 等) 的 运用 是 否 
熟练 而 准确 。 将 我 们 的 评估 结果 与 进行 同样 工作 的 其 他 专业 工作 组 的 评估 结果 进行 比较 , 或 从 
二 次 出 版 期 刊 所 摘要 的 文献 (6S 类 证 据 ) 中 提取 原始 数据 , 完成 数据 计算 ,然后 将 计算 所 得 结论 
与 摘要 中 的 结论 进行 验证 比较 。 

最 后 , 也 是 最 高 层次 的 要 求 , 是否 创建 了 任何 严格 评价 证 据 的 题目 (critically appraised topics， 
CAT ) 并 加 以 总 结 。 针 对 严格 评价 的 证 据 进行 总 结 评分 , 也 可 用 牛津 循 证 医学 中 心 提供 的 软件 
CATMaker RR 车 用 CATMaker, 粗略 的 计算 结果 是 否 与 CATMaker 软件 对 文献 质量 评估 进 

行 总 结 的 结果 一 致 。 虽 然 CATMaker 是 很 有 用 的 评价 工具 , 实际 临床 工作 中 使 用 较为 麻烦 , 也 
可 采用 更 为 简便 的 广 式 来 评价 .外 其 下 究 引用 临床 度 小 - 太 究 方法 的 两 行 式 指 过 以 及 结果 总 
结 简 表 等 来 简要 记录 评估 结果 。 


、 评 价 “整合 外 部 证 据 与 病人 价值 ”的 能 力 
表 15-4 中 列 出 了 一 些 在 自我 评价 “结合 外 部 证 据 与 自我 临床 经 验 " 以 及 评价 “将 检索 结果 
应 用 于 临床 实践 " 时 需要 考虑 的 因素 。 同 样 , 首先 需要 问 有 没有 将 严格 评价 的 证 据 与 临床 实践 
相 结合 。 如 果 没 有 把 已 经 严格 评估 的 证 据 应 用 到 实践 中 去 , 那 我 们 在 前 面 三 个 步骤 的 努力 将 是 
白费 工夫 。 因 此 ,车 这 一 步骤 没有 完全 实施 , 我 们 需要 认真 反思 , 时 间 和 精力 将 相应 调整 。 再 
次 强调 , 与 良师益友 进行 讨论 或 是 参与 专业 小 组 工作 将 非常 有 助 于 我 们 克服 这 个 “纸上谈兵 ”的 
问题 。 工 作 步 人 正轨 之 后 , 则 需 反 思 和 总 结 : 在 将 外 部 证 据 应 用 到 个 体 病例 的 过 程 中 我 们 能 不 


能 做 得 更 加 准确 和 高 效 ? 我 们 是 否 寻 找到 , 或 是 总 结 出 了 外 部 证 据 用 于 临床 实践 的 验 前 概率 ? 
(具体 可 参见 本 教材 第 九 章 ) 








表 15-4 ”对 “外 部 证 据 与 临床 经 验 的 结合 " 的 自我 评价 








条 目 具体 问题 
1 是 否 将 严格 评价 的 证 据 应 用 到 了 临床 实际 中 ? 
2 能 否 逐 渐 做 到 准确 且 熟 练 地 调整 严格 评价 的 指标 (例如 , 验 前 概率 , NNTW 等 ) 以 适应 具体 
的 病例 个 案 ? 


3 能 否 解释 ( 和 解决 ) 整 合 证 据 制定 决策 过 程 中 出 现 的 争议 ? 
我 们 是 否 能 更 加 熟练 
行 解释 (甚至 是 解决 )， 
用 于 教学 医院 的 住院 医生 。 






也 根据 病人 的 “因素 "(7) 对 治疗 措施 进行 调整 ”能 否 对 原 有 的 争议 进 
> 验 我 们 的 整合 能 力 是 否 有 所 提高 的 方法 之 一 , 这 一 评价 方法 尤其 适 


第 二 节 效果 评价 


目前 , 对 循 证 医学 实践 的 评价 不 仅仅 是 对 知识 技能 的 评价 , 更 重要 的 还 应 包括 对 行为 、 态 
度 的 评价 和 对 临床 实践 能 力 及 临床 结局 改善 的 评价 。 


FF 


一 、 临 床 实践 是 否 得 到 了 改善 


自我 评价 之 后 , 了 解 到 自我 开展 循 证 实践 的 能 力 。 在 具备 能 力 的 基础 上 , 进一步 应 评价 是 
否 将 所 具有 的 能 力 转 化 为 开展 循 证 实践 的 行动 , 进而 使 临床 实践 得 以 改善 。 因 此, 应 进一步 自 
问 学 到 的 知识 有 没有 转化 为 更 好 的 临床 实践 ? ( 表 15-5)。 这 方面 可 以 借鉴 在 质量 促进 中 ,已 被 
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证 实 为 有 效 的 方法 , 即 * 计 划一 实施 一 检查 一 行动 "循环 法 , 来 帮助 我 们 回答 能 力 是 否 转化 为 行 
动 的 问题 。 其 中 “计划 ”(plan) 以 提出 问题 、 寻 找 证 据 、 严格 评价 及 证 据 应 用 等 4 个 部 分 作为 开 
始 。 同 祥 需 要 考虑 : 运用 此 方法 时 可 能 会 遇 到 哪些 障碍 ， 以 及 是 否 需要 新 的 技能 、 设 备 、 组 织 程 
序 或 提醒 机 制 来 防止 遗忘 而 没有 开展 行动 。 
表 15-5 对 "行为 改变 "的 自我 评价 
条 目 具体 问题 
1 当 有 外 部 证 据 表明 需要 进行 改变 时 , 能 否 克服 障碍 进行 相应 的 行为 调整 ? 
有 没有 进行 检查 , 如 对 诊断 、 治 疗 及 其 他 临床 实践 方面 的 审计 ? 








在 拟订 要 开展 哪些 工作 的 计划 (plan) 后 ,需要 将 计划 付 诸 行 动 , 亦 就 是 实施 (do) 计 划 。 计 
划 试 行 一 段 时 间 后 , 可 以 看 计划 是 否 产 生效 果 。 然 后 检查 (check ) 是 否 行动 实施 后 有 相应 的 效 
果 变 化 。 车 试行 后 证 明 计划 有 效 , 则 可 推广 , 否则 , 需 重新 制订 计划 。 检 查 包括 对 临床 工作 进 
行 审计 (临床 审计 为 “一 个 质量 改进 的 过 程 , 旨 在 通过 对 卫生 保健 措施 系统 评价 而 对 明确 的 标准 
实施 变革 , 以 改善 病人 卫生 保健 状况 和 疾病 的 结局 " )。 需 要 开展 审计 的 原因 有 两 个 : 一 是 审计 
结果 可 以 显示 出 临床 医生 的 绩效 如 何 ; 其 二 , 也 是 更 重要 的 一 点 , 审计 通常 会 以 多 种 方式 进行 ， 
特别 是 个 体 反馈 , 这 对 改善 临床 工作 会 有 极 大 的 帮助 。 审 计 工作 长 期 、 持 续 、 恰 当地 进行 , 会 不 
断 地 改善 临床 实践 。 若 审计 结果 显示 临床 工作 有 所 改善 , 可 以 进一步 考虑 如 何 继续 提高 自身 的 
水 平 。 车 审计 显示 临床 工作 停滞 不 前 , 除了 自我 批评 之 外 , 我们 还 必须 找到 问题 的 根源 并 克服 
之 ,然后 制定 新 的 计划 , 进入 下 一 循环 。 


二 、 多 少 临 床 实践 有 证 可 循 


目前 ,许多 临床 工作 者 或 专业 小 组 研究 现 有 的 临床 实践 到 底 在 多 大 程度 上 是 有 证 可 循 的 。 
实际 从 事 临床 实践 的 工作 者 也 需要 和 有 必要 了 解 。1989 年 英国 著名 的 流行 病 学 家 lain Chalmers 
发 表 了 他 的 系统 综述 结果 : 当时 在 产科 使 用 的 226 种 方法 中 , 临床 试验 或 系统 综述 证 明 , 只 7 
20% 是 有 效 的 目 疗 效 大 于 不 良 反应 ; 30% 是 有 害 或 疗效 可 疑 ; 而 50% 缺乏 随机 试验 证 据 。 该 研 
究 结果 公布 后 震惊 全 球 , 继而 引发 了 对 循 证 医学 的 思考 和 关注 。 

1995 年 由 David Sackett 领衔 的 审计 小 组 ,对 牛津 某 临床 机 构 某 个 月 中 的 每 一 例 死亡 病例 、 
出 /人 院 病例 的 主要 诊断 (包括 :疾病 ,症状 .整体 情况 、 存 在 多 项 诊断 时 导致 病人 就 医 的 主诉 症 
状 ) 以 及 对 病人 实施 的 主要 干预 (包括 : 针对 主要 诊断 所 采取 的 治疗 、 操 作 及 辅助 治疗 等 ) 进 行 
讨论 , 随后 对 干预 进行 追踪 。 审 计 小 组 基于 当时 的 循 证 医学 即时 资源 汇编 及 检索 其 他 资源 (如 
医学 教科 书 、 医 学 电子 数据 库 .已 发 表 的 文献 等 ), 最 后 将 干预 措施 分 为 三 类 : 

1. 已 有 一 项 或 多 项 随机 对 照 试验 或 有 系统 综述 支持 其 有 效 性 (或 证 明 其 无 效 ) 的 干预 ; 

2. 有 效 性 已 得 到 公认 ,审计 小 组 认为 再 对 其 疗效 进行 随机 对 照 试验 是 毫 无 必要 的 , 且 车 设 
立 安慰 剂 对 照 , 不 符合 伦理 学 的 干预; 

3. 已 得 到 普遍 使 用 , 但 不 属于 上 述 两 种 情况 者 。 

在 该 月 诊断 的 109 名 患者 中 , 根据 上 述 的 分 类 , 90 名 (82% ) 患 者 接受 的 干预 是 有 证 可 循 的 ， 
其 中 53% 的 患者 所 接受 的 主要 干预 措施 得 到 了 -项 或 多 项 随机 试验 或 系统 评价 的 支持 , 29% 
的 患者 所 接受 的 干预 措施 有 明确 可 信 的 、 非 试验 性 研究 的 证 据 支持 。 另 有 18% 的 患者 , 他 们 接 
受 的 对 症 治疗 或 支持 疗法 虽 无 有 力 的 证 据 支持 , 但 目前 的 干预 优 于 其 他 干预 或 没有 干预 。 这 次 
审计 的 结果 确认 了 住院 病人 所 接受 的 干预 应 该 是 有 证 可 循 的 。 从 此 以 后 , 世界 范围 内 的 多 个 临 
床 机 构 都 进行 了 类 似 研究 , 审计 涉及 了 临床 医学 的 不 同 领域 , 如 : 普 外 科 、 血液 科 、 儿科、 基础 保 
健 .麻醉 科 及 精神 科 。 事 实 上 ,我 们 所 遇见 的 绝 大 多 数 病人 都 只 患 有 -一 种 或 两 种 常见 病 , 而 为 
常见 问题 寻找 证 据 将 会 比 为 罕见 问题 寻找 证 据 更 加 有 效 。 上 述 研究 还 为 各 种 常见 问题 累积 了 








拼 
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众多 证 据 , 从 而 保证 开展 循 证 医学 实践 的 切实 可 行 。 
最 后 , 需要 强调 的 是 : 审计 不 仅仅 是 关注 如 何 为 某 个 临床 问题 寻找 到 高 质量 的 证 据 , 审计 
同时 更 是 一 个 逐步 学 习 的 过 程 , 它 能 帮助 工作 小 组 里 的 每 一 个 成 员 进 行 知识 更 新 。 


第 三 节 案 例 


皮质 类 固 醇 产 前 应 用 于 有 早产 风险 的 妇女 加 速 胎儿 肺 成 熟 的 循 证 实践 及 其 效果 : 

早产 儿 是 婴儿 死亡 的 主要 原因 (65%), 而 肺脏 发 育 不 成 熟 致 新 生 儿 呼吸 窘迫 综合 征 是 时 产 
儿 死亡 的 主要 原因 。1972 年 Liggins 等 在 动物 研究 的 基础 上 , 首次 开展 了 皮质 类 固 醇 产 前 应 用 
于 有 早产 风险 的 妇女 预防 新 生 儿 呼吸 窘迫 综合 征 的 随机 对 照 试 验 (RCT), 至 1990 年 又 有 7 项 
RCT 发 表 。 然 而 , 其 效果 不 尽 一 致 , 1990 年 Patricia Crowjley Iain Chalmers 等 首次 对 产 前 用 皮质 
类 固 醇 的 效果 开展 了 系统 综述 和 meta 分 析 。 

该 分 析 表 明 , 皮质 类 固 醇 总 体 上 以 及 在 所 分 析 的 所 有 亚 组 均 能 够 降低 新 生 儿 呼吸 窒 迫 综合 
征 的 发 生 。 皮 质 类 辕 醇 可 降低 30%~50% 有 早产 风险 的 妇女 新 生 儿 死 于 早产 综合 征 的 几率 。 而 
新 生 儿 呼吸 窘迫 综合 征 的 降低 , 与 降低 脑室 内 出 血 (intraventricular haemorrhage, IVH )、 坏死 性 
小 肠 结肠 炎 (necrotizing enterocolitis, NEC) 和 新 生 儿 死亡 有 关 , 同时 没有 强 有 力 的 证 据 表明 皮质 
类 固 醇 有 副作用 。 

在 该 系统 综述 和 meta 分 析 发 表 之 前 , 大 多 数 妇 产科 医生 没有 意识 到 该 治疗 方法 这 样 有 效 ， 
而 且 该 方法 也 没 得 到 广泛 使 用 。 结 果 成 后 上 万 的 早产 儿 可 能 震 患 新 生 儿 呼吸 窘迫 综合 征 且 发 
生 不 必要 的 死亡 ( 且 须 比 实际 需要 更 贵 的 治疗 )。1991 年 第 一 个 Cochrane 系统 评价 发 表 后 , 类 
国 国立 卫生 研究 院 (NIH ) 发 表 共 识 , 毫 不 含糊 地 推荐 除 少数 以 外 , 产 前 皮质 类 固 醇 治疗 早产 风 
险 的 妇女 会 大 幅 降 低 新 生 儿 发 病 率 和 死亡 率 并 可 以 节省 大 量 的 医疗 费用 。 

在 该 系统 综述 发 表 前 后 收集 的 资料 表明 ,综述 发 表 时 大 约 20% 的 早产 风险 的 妇女 使 用 皮 
质 类 固 醇 。 该 综述 发 表 后 皮质 类 辕 醇 的 使 用 在 NIH 推荐 之 前 开始 稳步 增长 , 到 1996 年 使 用 率 
攀升 到 65%; 同期 1991 一 1996 年 间 的 资料 表明 , 随 着 皮质 类 国 醇 使 用 的 普及 , 婴儿 死亡 率 相应 
地 降低 。 

















( 赵 亚 双 ) 
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科学 人 镀 究 的 本 质 是 创造 和 生产 新 知识 ， 因此 科研 工作 本 身 是 一 种 非常 复杂 的 、 难 度 较 高 的 、 
以 脑力 劳动 为 主 的 活动 , 它 具有 继承 性 、 创造性 、 探 索性 等 基本 特点 。 作为 一 门 理论 发 展 快 且 
实践 性 强 的 学 科 , 临床 医学 的 科学 研究 对 推动 临床 医学 整个 学 科 发 展 的 作用 越 来 越 显 著 。 如 何 
做 好 临床 医学 的 科研 , 提升 在 疾病 诊治 预后、 病因 学 等 方面 的 临床 医学 研究 水 平 , 是 每 一 位 临 
床 医生 和 | 临床 医学 生 所 面临 的 共同 挑战 。 因 此 ， 在 了 解 临床 医学 科学 研究 的 种 类 及 研究 基本 程 
序 的 基础 上 , 掌握 临床 医学 研究 项 目 申报 书 要 领 、 撰 写 出 高 质量 的 申报 书 ， 是 医院 学 术 水 平和 
综合 研究 能 力 的 具体 体现 , 也 是 学 科 发 展 和 临床 医学 工作 者 基本 素质 的 标志 。 


第 


一 、 科 学 研究 的 基本 程序 
科学 研究 应 涵盖 从 提出 问题 、 验 证 假说 到 得 出 结论 等 全 过 程 。 其 基本 程序 和 具体 步骤 包 
括 : 查阅 文献 .提出 临床 医学 科学 问题 和 理论 假说 制订 研究 计划 及 设计 研究 方案 、 撰写 项 目 申 
报 书 、 获 得 资助 后 的 项 目 启动 与 实施 (实验 观察 或 调查 )、 研 究 资料 的 整理 与 数据 处 理 、 统计 分 
析 、 研 究 结果 的 归纳 和 总 结 、 撰 写 研究 报告 以 及 成 果 转 化 等 。 


二 、 临 床 科研 的 基本 类 型 


要 撰写 高 质量 的 临床 医学 研究 项 目 申报 书 ,首先 要 了 解 临 床 科研 的 具体 类 型 。 按 研究 任务 
来 源 、 科 技 活动 类 型 及 研究 内 容 可 归纳 为 以 下 几 方 面 : 

1. 按 任务 来 源 可 分 为 纵向 科研 任务 、 横 向 科研 任务 及 自由 选 题 项 目 。 其 中 : 纵向 科研 任 
务 是 指 各 级 政府 主管 部 门下 达 的 课题 及 项 目 ,包括 国家 自然 科学 基金 委员 会 设立 的 各 类 科学 研 
究 基 金 , 政府 管理 部 门 科研 基金 ,如 科技 部 /卫生 部 的 科学 研究 基金 , 以 及 单位 科研 基金 。@ 横 
向 科研 任务 是 以 横向 科技 合同 为 依据 的 项 目 , 它 主 要 由 企业 、 事 业 单位 及 其 他 机 构 委托 进行 ， 
研究 经 费 一 般 由 委托 单位 提供 。@ 自 由 选 题 , 是 根据 学 科 发 展 和 科技 人 员 的 专长 , 并 结合 医疗 
卫生 工作 的 实际 需要 , 由 科技 人 员 自己 提出 的 研究 课题 。 

2. 按 科技 活动 类 型 可 分 为 : 基础 研究 、 应 用 研究 及 发 展 研究 。 其 中 : 四 基 础 研究 是 以 认识 
自然 现象 、 探 索 自然 规律 为 目的 ,未 涉及 或 仅 笼统 涉及 社会 应 用 设想 的 研究 活动 。@ 应 用 研究 ， 
主要 针对 某 个 特定 的 、 有 实际 应 用 价值 的 目标 开展 的 研究 活动 。@ 发 展 研究 , 也 称 开发 研究 ， 
是 运用 基础 研究 和 应 用 研究 的 成 果 , 旨 在 推广 新 材料 、 新 产品 、 新 设计 、 新 流程 和 新 方法 , 或 对 
之 进行 重大 的 、 实 质 性 改进 的 创造 活动。 


三 、 科 研 项 目 申请 前 的 准备 


























(一 ) 文献 调研 
文献 查阅 和 复习 ,既是 课题 选择 的 前 提 , 也 是 产生 或 形成 临床 医学 科学 问题 假设 的 前 提 。 
通过 文献 查阅 . 可 以 把 握 本 学 科 的 整体 发 展 水 平 , 找 出 当前 研究 的 热点 和 焦点 问题 , 了 解 这 些 
间 题 在 国内 外 的 研究 现状 ; 根据 文献 调研 , 还 可 预测 本 学 科 及 相关 学 科 的 发 展 趋势 以 及 未 来 的 
发 展 方向 , 帮助 形成 课题 研究 的 基本 思路 。 
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进一步 将 拟 研 究 的 题目 与 相关 研究 文献 进行 比较 , 精读 文献 , 了 解 验证 研究 假设 的 技术 方 
法 以 及 在 本 学 科 和 本 专业 的 应 用 现状 , 思考 拟 进行 的 研究 可 以 探讨 哪些 临床 医学 问题 , 有 哪些 
特色 和 创新 之 处 , 进一步 构思 研究 方案 。 

(二 ) 研究 基础 与 预 实验 

明确 相关 研究 基础 以 及 与 本 次 选 题 的 关系 , 若 无 现 成 的 文献 资料 可 供 参考 , 也 可 进行 预 实 
验 或 小 规模 的 预 调查 , 以 进一步 理 清 思 路 、 找 准 问题 、 选 题 立 题 , 为 撰写 申报 书 做 好 铺垫 。 


第 二 节 ”研究 设计 报告 书 的 基本 内 容 与 撰写 方法 


一 、 课 题名 称 及 摘要 

(一 ) 申报 课题 名 称 

课题 名 称 是 对 申请 课题 的 研究 方法 ,研究 对 象 . 研 究 是 标的 综合 描述 , 要 体现 出 特色 深度 
及 创新 , 表达 要 简洁 明了 、 语 言 修辞 要 正确 、 题 目 要 有 吸引 力 和 可 信 度 。 

(二 ) 申报 书 摘要 

摘要 是 申报 书 的 高 度 概 括 , 有 固定 的 字数 要 求 ,一般 在 400 字 左 右 , 要 求 所 描述 内 容 充满 新 
意 , 阐述 的 条 理 非常 清楚 。 摘 要 应 介绍 所 申请 项 目的 研究 青 景 和 现状 、 存 在 问题 、 立 题 依据 , 研 
究 目的 和 重要 意义 ,研究 方法 与 主要 技术 路 线 , 以 及 预期 研究 结果 等 。 

撰写 摘要 时 , 应 围绕 下 列 问题 依次 展开 : 即 目前 存在 的 主要 科技 或 者 科学 问题 是 什么 ? 为 
何 要 进行 研究 ? 本 研究 拟 采用 的 主要 方法 及 技术 手段 是 什么 ? 可 以 达到 的 研究 目标 及 意义 是 
什么 (包括 科学 意义 /潜在 价值 或 者 应 用 前 景 ) 





初次 撰写 摘要 时 , 也 可 参考 如 下 撰写 格式 , 填写 相关 内 容 :“…… 是 …… 防 治 的 瓶颈 , 但 其 
机 制 尚未 明了 。 本 课题 拟 采 用 ……' 手 段 (模型 技术、 方法 ), 研究 …… 机 制 (环节 ), 特别 是 …… 
的 规律 (作用 ) 应 用 ……, 进一步 探讨 …… 的 新 方法 (技术 )。 为 …… 提 供 科学 的 理论 依据 和 安 
全 有 效 地 …… 方法 , 必 将 具有 广阔 的 应 用 前 景 "。 要 特别 注意 摘要 与 申报 书 的 所 有 内 容 一 致 .前 
后 呼应 。 
二 、 立项 依据 


项 目的 立项 依据 是 判定 研究 设计 是 否 具有 创新 性 .科学 性 、 可 行 性 、 实 用 性 、 效 能 性 的 基 
础 。 该 部 分 需要 具体 阐述 研究 意义 、 国 内 外 研究 现状 及 发 展 动态 , 结合 科学 研究 发 展 趋势 来 论 
述 科学 意义 或 应 用 前 景 。 同 时 应 附 主要 参考 文献 目录 。 
(一 ) 介绍 申报 项 目 提出 的 重要 科学 问题 
本 项 目 所 关注 的 一 定 是 国内 外 尚未 解决 或 者 亟待 解决 的 重要 科学 问题 , 以 及 临床 实践 中 发 
现 的 .具有 重大 意义 的 研究 问题 。 特 别 要 突出 研究 对 国民 经 济 和 社会 发 展 的 重要 性 、 迫 切 性 。 
(二 ) 描述 国内 外 相关 问题 的 研究 现状 及 发 展 动态 
重点 阐述 国内 外 相关 问题 的 研究 现状 , 特别 是 与 本 课题 研究 思路 , 拟 采 用 的 技术 方法 相似 
的 研究 现状 , 注意 提炼 、 归 纳 、 总 结 出 学 科研 究 中 存在 问题 .热点 和 难点 ; 同时 还 要 对 国内 外 研 
究 的 发 展 动态 进行 分 析 , 这 些 都 是 形成 立 题 思路 和 提出 立 题 点 的 关键 , 用 以 充分 说 明 这 些 问题 
是 吸 待 解决 、 需 深入 探讨 的 重要 科学 问题 。 

(三 ) 申报 项 目的 假设 和 研究 思路 

提出 本 次 申报 项 目的 理论 设想 或 假设 , 介绍 拟 通过 什么 研究 思路 、 采 用 何 种 方法 和 技术 手 
段 .重点 解决 哪些 问题 。 
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(四 ) 参考 文献 引用 的 注意 要 点 
申报 书 的 撰写 , 特别 是 对 其 创新 性 、 科 学 性 和 应 用 价值 等 的 阐述 和 论证 , 要 有 充分 的 依据 ， 
这 些 都 需要 有 可 靠 权 威 的 文献 材料 来 支撑 (包括 引用 相关 文献 中 的 论题 、 观 点 、 概 念 、 理 论 、 方 
法 、 结 果 .结论 或 重要 事实 、 数 据 等 )。 通 过 追踪 和 引述 本 研究 领域 近期 发 表 的 相关 文献 , 阐明 
本 项 目的 前 沿 性 或 新 颖 性 , 提出 创新 点 。 近 3 年 的 文献 量 应 该 占 2/3 左右 , 最 好 引用 一 定 比 例 的 
年 参考 文献 , 以 展示 申请 者 知晓 国内 外 最 新 研究 进展 和 发 展 动态 ; 同时 注意 引用 国内 外 重要 
高 质量 的 研究 文献 , 以 及 引用 与 自己 研究 高 度 相关 的 参考 文献 , 以 论证 或 说 明 所 申报 项 目 
的 科学 性 和 重要 性 。 


三 、 研 究 目标 .研究 内 容 及 拟 解决 的 关键 科学 问题 


(一 ) 研究 目标 
指 研究 拟 要 达到 的 目的 (最 终 目标 ), 是 对 题目 、 研 究 对 象 . 研 究 方法 、 成 果 和 应 用 的 高 度 概 
括 和 具体 化 。 将 研究 内 容 中 阶段 性 成 果 简 单 罗列 在 一 起 不 能 算 作 研 究 目 标 。 撰 写 研 究 目 标 , 可 





参考 如 下 格式 : “通过 ……( 技 术 和 手段 ), 解决 …… 的 问题 、 证 实 (验证 、 曾 明 )…… 的 科学 假设 
(假说 ),……… 环节 ? 解决 (揭示 )…… 的 关键 科学 (技术 ) 问 题 , 预期 达到 …… 目 的 ”。 


(二 ) 研究 内 容 

研究 内 容 是 对 研究 目标 的 深层 次 诠释 ,或 者 说 是 对 研究 目标 的 具体 说 明 。 撰 写 "研究 内 容 ” 
时 ,要 围绕 研究 目标 逐 层 、 逐 次 展开 ,强调 为 了 实现 研究 目标 , 研究 分 几 个 步骤 进行 , 拟 从 何 处 
入 手 , 重点 研究 哪个 方面 ,主攻 什么 方向 ,达到 什么 样 的 预期 效果 以 及 有 哪些 具体 的 考核 和 稀 
量 指标 等。 

研究 内 容 妆 具体 适当 、 重 点 要 突出 、 层 次 要 分 明 、 用 词 要 严谨 .研究 任务 要 明晰 。 切 尽 内 容 
过 多 研究 周期 内 难以 完成 或 内 容 分 散 ,研究 目标 无 法 逐一 实现 。 

(三 ) 拟 解决 的 关键 科学 问题 

拟 解决 的 关键 科学 问题 要 反映 申请 者 对 课题 总 体 目标 实现 的 深刻 理解 和 统筹 解决 的 能 力 。 
该 部 分 主要 涉及 研究 过 程 中 的 一 些 关键 技术 问题 .科学 手段 等 ,这 些 关键 问题 决定 了 研究 能 否 
有 科学 新 发 现 、 实 验方 法 学 有 新 突破 、 技 术 有 创新 等 。 注 意 技 术 和 设备 上 或 者 课题 合作 时 可 能 
出 现 的 困难 等 ,不 能 当做 拟 解决 的 关键 科学 问题 。 此 部 分 撰写 时 ,要 陈述 对 关键 问题 拟 采用 的 
解决 方案 及 备用 解决 方案 等 。 











习 





四 、 研 究 方案 与 可 行 性 分 析 


研究 方案 是 申报 书 中 文字 篇 幅 最 大 的 部 分 , 是 在 研究 目标 和 研究 内 容 确定 之 后 , 对 项 目 具 
体 实施 方案 的 详尽 描述 , 撰写 方法 可 因 人 而 异 , 以 时 间 顾 序 为 主线 或 以 研究 内 容 为 主线 描述 研 
究 方案 均 可 , 但 要 分 大 小 标题 , 突出 逻辑 关系 , 详细 地 写 清楚 每 个 具体 步骤 , 具体 闲 述 研究 方 
法 和 技术 路 线 , 对 复杂 的 技术 路 线 和 研究 方法 可 采用 流程 图 或 图 表 来 说 明 。 研 究 方案 撰写 时 
要 注意 叙述 清晰 详细 和 上 下 文 逻 辑 性 , 过 于 简单 和 过 于 繁杂 都 不 可 取 。 下 面 分 儿 个 方面 重点 
介绍 : 

(一 ) 研究 因素 

一 项 研究 在 决定 了 研究 目标 和 内 容 后 ,就 应 该 确定 合适 的 研究 因素 , 即 研究 变量 。 描 述 所 
选择 的 变量 ( 因 变 量 和 自 变量 ) 及 其 规定 , 因 变 量 也 叫 结局 变量 , 一般 指 发 病 、 死 亡 、 伤 残 治愈、 
有 效 .无 效 某 个 观察 指标 变化 等 事件 。 自 变量 就 是 影响 或 者 决定 因 变量 的 有 关 因素 ,如 疾病 
史 、 家 族 史 、 疾 病 类 型 、 基 础 疾病 、 药 物种 类 和 剂量 以 及 行为 生活 方式 (饮食 习惯 、 食 物种 类 等 生 
物 因素 , 体力 活动 等 行为 因素 ), 一 项 研究 中 涉及 的 自 变 量 和 因 变 量 可 能 很 多 , 大 多 能 通过 病历 、 
专门 设计 的 调查 表 和 记录 表 等 途径 加 以 测量 。 在 选择 变量 , 特别 是 确定 自 变量 时 一 定 要 充分 考 
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虑 到 它 与 因 变量 之 间 的 生物 学 关系 及 导 辑 学 上 的 合理 性 。 

申报 书 应 介绍 研究 变量 的 规定 和 说 明 , 将 这 些 规定 书写 成 文 , 例如 ,疾病 的 诊断 及 预后 标 
准 等 。 

(二 ) 研究 方法 

研究 目的 不 同 , 研究 方法 也 不 尽 相 同 , 同一 项 研究 也 可 用 多 种 研究 方法 。 研 究 方法 的 陈述 
主要 包括 所 用 的 研究 设计 类 型 、 生 物 学 技术 与 方法 、 统 计 学 分 析 方 法 、 干 预 方法 .资料 收集 方法 
等 , 均 应 说 明 , 以 体现 研究 设计 的 合理 性 和 可 行 性 , 以 及 能 够 获得 真实 可 靠 研究 结果 的 可 能 性 。 

1. 研究 设计 类 型 ”应 确定 在 研究 中 用 人 群 研究 的 方法 , 还 是 进行 动物 实验 或 体外 研究 。 人 
群 研究 的 设计 类 型 主要 有 观察 性 研究 和 实验 性 研究 。 可 用 观察 性 研究 中 的 现 况 研究 方法 调查 
某 一 疾病 在 人 群 的 患 病 率 , 如 慢性 肾病 的 流行 病 学 调查 ; 用 病例 对 照 研究 和 队列 研究 进行 病因 
学 和 危险 因素 的 研究 , 如 中 青年 脑 梗死 危险 因素 的 病例 对 照 研究 , 妊娠 期 高 血球 对 低 出 生体 重 
影响 的 队列 研究 等 ; 用 实验 性 研究 中 的 临床 试验 方法 进行 药物 疗效 的 评价 , 如 某 新 药 治疗 原 发 
性 高 血压 的 多 中 心 随 机 对 照 临 床 试验 , 等 等 。 

2. 生物 学 技术 与 方法 ”介绍 项 目 所 用 的 细胞 生物 学 技术 、 蛋 白 分 析 技 术 ,核酸 分 析 技 术 等 。 
如 用 流 式 细胞 仪 测 定 活 细胞 的 某 种 蛋白 , 用 酶 联 免疫 吸附 试验 测定 血清 中 某 种 蛋白 , 用 实时 定 
量 PCR 的 方法 扩 增 核酸 等 。 

3. 干预 方法 “临床 医学 研究 中 的 干预 措施 至 关 重要 , 是 决定 研究 成 败 的 关键 之 一 。 干 预 措 
施 种 类 繁多 ,干预 方法 各 有 不 同 , 要 做 详尽 介绍 。 如 某 种 药物 的 疗效 评价 , 干预 措施 为 给 予 研 
究 对 象 某 种 药物 ,要 确定 并 详细 介绍 干预 组 和 对 照 组 用 药 的 药物 名 称 、 生 产 三家、 剂量、 疗程 、 
给 药 途 径 、 疗 效 和 不 良 反 应 的 观察 方法 .不 良 反 应 的 处 理 措施 等 。 当 然 , 疗效 评价 研究 中 所 用 
干预 措施 还 可 以 是 一 种 治疗 方案 和 策略 或 其 他 干预 措施 的 疗效 评价 。 对 照 组 种 类 很 多 , 标准 对 
照 即 给 予 常规 药物 , 安慰 剂 对 照 需 给 予 安 慰 剂 ,常规 药物 和 安慰 剂 用药 情 况 同样 应 做 详细 介绍 。 
另外 , 干预 措施 的 依从 性 是 影响 药物 疗效 的 重要 问题 , 提高 依从 性 和 依从 性 监测 的 方法 要 有 合 
理 的 安排 。 

4. 资料 收集 方法 ”资料 的 收集 方法 是 临床 研究 设计 的 重要 内 容 。 获 取 资 料 的 方法 一 定 要 
介绍 清楚 , 一般 有 两 种 , 一 种 是 指 按 研究 设计 方案 通过 专门 调查 或 检查 检验 所 收集 的 资料 , 如 
现场 询问 、 信 访 或 电话 访问 , 医学 检验 、 体 检 或 直接 观察 中 获得 ; 另 一 种 是 从 个 人 记录 ( 病历 等 
医学 记录 ) 或 某 些 部 门 的 资料 (人 口 普查 、 生 命 统计 、 死 亡 登 记 ,疾病 登 记 . 电 子 健康 档案 ) 中 获 















































得 。 如 临床 经 济 学 分 析 , 需要 说 明 这 些 费 用 数据 的 来 源 , 直接 成 本 和 间接 成 本 计算 的 依据 和 种 





类 ， 调 查 表 是 资料 收集 的 最 主要 工具 之 一 。 

绝 大 多 数 的 研究 都 是 通过 调查 表 来 收集 所 需 的 资料 或 信息 的 。 在 申请 书后 要 附 所 用 调查 
表 , 并 且 应 介绍 保证 调查 真实 性 的 具体 措施 。 

要 介绍 生物 学 材料 , 如 研究 对 象 的 血 、 尿 、 便 或 组 织 标本 等 的 采集 方法 , 储存 条 件 , 以 及 用 
采集 的 生物 学 标本 进行 何 种 实验 室 检验 或 其 他 检查 。 以 及 所 用 仪器 设备 的 型 号 .生产 厂家 等 。 

5. 统计 学 分 析 方法 ”申报 书 中 要 介绍 数据 分 析 的 方法 , 要 列 出 分 析 的 主要 项 目 及 指标 、 所 
应 用 的 统计 学 方法 , 如 治疗 组 与 对 照 组 血压 值 的 比较 方法 , 有 效率 及 治愈 率 的 比较 方法 , 多 因 
素 模型 的 建立 方法 ,对 建 模 因 素 的 选择 、 混 杂 因 素 的 处 理 以 及 因素 间 的 交互 作用 分 析 等 。 要 介 
绍 统计 学 分 析 方 法 的 名 称 , 如 卡 方 检验 、 相 对 危险 度 及 其 95% 可 信 区 间 .logistic 回归 模型 .Cox 
比例 风险 模型 等 , 具体 何 种 研究 采用 何 种 分 析 方法 , 请 参见 有 关 医 学 统计 学 书籍 的 详细 论述 。 

(三 ) 研究 对 象 及 样本 大 小 

根据 研究 目的 .人 研究 内 容 ,研究 方法 选择 研究 对 象 , 介绍 选择 研究 对 象 的 依据 , 研究 对 象 来 
源 .纳入 及 排除 标准 、 随 机 抽样 和 分 组 的 方法 .样本 大 小 计算 的 依据 和 方法 , 等 等 。 

1. 来 源 全 究 对 象 的 来 源 要 根据 研究 的 性 质 和 方法 来 确定 。 如 果 研 究 对 象 为 病人 , 可 从 医 
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院 、 门 诊 的 病人 中 选取 , 也 可 从 社区 的 疾病 监测 资料 或 普查 、 抽 查 的 人 群 资料 中 获得 , 有 时 也 
可 利用 单位 团体 中 所 有 被 诊断 的 病例 。 一 般 以 社区 人 群 来 源 最 优 , 它 的 代表 性 强 , 但 不 容易 得 
到 , 故 这 种 情况 多 采用 医疗 机 构 的 病人 。 如 果 同 时 要 为 病人 选取 对 照 , 必须 与 病人 来 源 于 一 个 
总 体 。 

2. 选择 标准 ” 即 根据 什么 标准 选择 研究 对 象 。 如 可 以 限定 研究 对 象 的 人 口 学 特征 , 包括 性 
别 、 年 龄 .民族 、 职 业 等 ; 如 果 研 究 对 象 是 某 一 种 病人 , 要 说 明 该 病 的 诊断 标准 及 依据 、 疾 病 的 类 
型 等 ; 为 防止 研究 因素 以 外 因素 的 影响 , 最 好 剔除 具有 所 研究 疾病 或 健康 状态 的 另外 一 些 影响 
因素 的 对 象 , 如 存在 与 研究 因素 有 联系 的 其 他 疾病 或 健康 状态 时 , 亦 应 予以 吻 除 ; 为 提高 研究 
效率 , 可 以 将 研究 对 象限 制 在 居住 于 一 定 地 区 及 一 定年 限 。 

3. 随机 抽样 和 随机 分 组 方法 ”大 多 数 研究 是 不 可 能 以 目标 人 群 的 全 体 作为 研究 对 象 的 , 这 
里 就 涉及 一 个 抽样 的 问题 。 一 项 研究 采用 什么 样 的 抽样 方法 应 在 设计 中 交代 清楚 , 有 助 于 估计 
研究 的 可 靠 性 和 精确 性 。 如 , 在 流行 病 学 调查 研究 中 使 用 的 抽样 方法 主要 有 单纯 随机 抽样 、 系 
统 抽 样 、 分 层 抽 样 、 整 群 抽样 和 多 级 抽样 。 在 临床 试验 中 如 何 进行 随机 分 组 , 等 等 。 具 体 见 本 
教材 第 三 章 有 关内 容 。 

4. 样本 大 小 估计 在 流行 病 学 研究 中 , 增加 样本 含量 是 减少 抽样 误差 、 提 高 研究 精确 性 的 
最 基本 的 方法 。 但 样本 过 大 会 徒然 浪费 人 力 物力、 时 间 和 费用 , 因此 , 一般 要 根据 研究 目的 与 
需要 确定 合适 的 样本 含量 。 样 本 含量 的 估计 一 般 根据 研究 的 类 型 确定 , 应 介绍 所 用 统计 学 中 样 
本 大 小 的 计算 公式 以 及 估计 依据 。 

(四 ) 技术 路 线 

技术 路 线 是 项 目 实施 的 流程 图 , 是 针对 研究 目标 、 研 究 内 容 、 研 究 方法 等 所 制定 的 合理 可 
行 的 路 径 。 用 图 文 混 排 的 形式 表示 . 可 能 更 为 清晰 简单, 一目了然。 撰写 时 一 定 要 与 项 目的 
研究 目的 、 研 究 内 容 、 研 究 目 标 等 环节 相互 衔接 , 达到 研究 目标 明确 、 研 究 内 容 充实 、 研 究 范围 
合理 、 实 验 设计 较为 完善 、 实 施 过 程 可 行 的 目的 。 

(五 ) 可 行 性 分 析 

可 行 性 分 析 主要 考察 课题 组 是 否 有 能 力 和 条 件 完成 所 申请 的 项 目 , 即 已 经 具备 的 人 员 、 设 
备 、 技 术 或 者 方法 学 上 的 能 力 和 保证 , 内 容 包括 : 

1. 条 件 及 资源 已 具备 项 目 所 需要 的 实验 环境 条 件 、 设 备 与 物资 , 以 及 可 以 从 医院 或 社区 
收集 到 的 研究 所 需 的 病例 及 其 他 研究 对 象 , 所 用 的 实验 动物 等 。 

2. 工作 积累 ”课题 组 前 期 的 相关 工作 积累 已 经 为 所 申请 项 目 创造 了 条 件 。 

3. 研究 团队 能 力 ”人 员 结 构 合理 , 如 研究 团队 中 有 教授 、 副 教授 ， 或 主任 医师 及 副 主 任 医 
师 作 指导 , 掌握 关键 技术 的 技术 人 员 ,研究 团队 成 员 的 前 期 工作 或 研究 背景 与 本 次 申请 项 目 有 
关 , 能够 胜任 申请 项 目 所 承担 的 工作 。 具 备 了 完成 课题 的 能 力 。 

(六 ) 质量 控制 

一 项 临床 医学 研究 的 目的 是 为 了 展示 临床 医学 中 的 客观 现象, 揭示 其 真实 规律 , 任何 研究 
者 均 希 望 将 误差 或 偏 倚 控 制 到 尽 可 能 小 , 研究 质量 的 控制 是 贯穿 于 整个 研究 过 程 中 的 , 因此 ， 
应 根据 相关 专业 知识 分 析 在 整个 研究 过 程 中 每 个 阶段 产生 误差 或 偏 倚 的 可 能 性 , 如 研究 对 象 的 
选择 过 程 、 资 料 收集 阶段 .资料 整理 、 资 料 分 析 等 环节 , 制定 正确 的 质量 控制 的 对 策 或 措施 , 有 
关 在 研究 各 环节 可 能 出 现 的 误差 或 偏 倚 的 来 源 及 其 测量 与 控制 方法 , 有 关 章 节 已 有 详细 介绍 ， 
在 制定 质量 控制 对 策 与 措施 时 , 可 根据 不 同 的 研究 目的 与 研究 方法 参照 有 关内 容 , 制定 具体 的 
切合 实际 的 质量 控制 方法 。 


五 、 项 目的 特色 与 创新 之 处 
特色 与 创新 即 在 本 项 目 研究 领域 中 申请 者 与 国内 外 同行 所 不 同 。 应 从 对 包括 项 目的 立论 
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依据 、 研 究 内 容 、 研 究 方 法 与 手段 、 技 术 路 线 及 其 实验 方案 上 的 研究 与 创新 点 进行 概括 、 提 炼 并 





t 





集中 反映 出 来 。 主 要 包括 理论 的 创新 , 技术 或 方法 的 创新 。 可 以 做 如 下 描述 : “通过 …… 实 验 、 
临床 过 程 , 提出 …… 研 究 的 假设 ,通过 …… 手 段 和 方法 证 明 ……; 采用 …… 实 验方 法 , 实验 技术 
解决 …… 中 …… 关 键 问题 ; 本 研究 的 特色 是 从 …… 方 面 人 手 ,对 …… 的 问题 进行 研究 ,期 望 阐 
明 ……, 揭示 …… 机 制 。 这 些 研究 在 国内 外 鲜 有 报告 。 此 外 , 通过 …… 的 研究 , 为 临床 的 应 用 
提供 …… 依 据 "。 


六 、 年 度 研 究 计划 及 预期 研究 结果 

(一 ) 年 度 研究 计划 

合理 地 划分 年 度 计划 进展 , 体现 所 制定 的 目标 能 够 完成 。 此 部 分 撰写 的 目标 基本 上 是 按照 
课题 的 研究 内 容 、 研 究 方法 和 技术 路 线 所 制订 的 方案 进行 的 。 一 般 为 准备 或 预 实验 预 调查 阶 
段 , 项 目 实施 阶段 , 项目 总 结 阶段 。 各 阶段 完成 的 内 容 , 具体 实施 计划 , 以 及 不 同 阶段 之 间 的 衔 
接 要 做 清晰 的 介绍 。 

(二 ) 预期 研究 成 果 

预期 研究 成 果 撰写 要 涵盖 理论 成 果 , 应 用 成 果 等 。 预 期 研究 成 果 与 “研究 特色 和 创新 " 基本 
上 应 该 一 致 。 即 在 某 一 理论 方面 有 所 建树 或 在 某 项 关键 技术 方法 学 上 获得 创新 。 

预期 研究 成 果 中 应 报告 论文 撰写 的 篇 数 和 质量 ,包括 国内 外 期 刊 、 国 内 外 学 术 会 议论 文 等 。 
也 包括 : 拟 组 织 或 参加 的 国内 外 重要 学 术 交 流 活动 、 国 际 合作 项 目 、 交 流 计划 、 专 利 等 。 


七 、 研 究 基础 与 研究 团队 介绍 

(一 ) 研究 基础 

研究 基础 撰写 时 要 介绍 申请 项 目前 期 的 工作 积累 。 注 意 描述 通过 前 期 工作 , 所 发 现 的 与 本 
次 研究 相关 的 问题 与 线索 ,前 期 工作 成 绩 为 本 次 申请 项 目 莫 定 了 基础 , 如 : 建立 的 某 一 方法 学 
技术 , 建立 的 某 种 疾病 预后 研究 的 队列 等 。 工 作 基础 不 仅仅 指 申报 者 个 人 的 工作 基础 , 要 特别 
注意 整个 研究 团队 、 学 科 或 者 学 校 的 相关 工作 基础 .人 员 和 设备 的 资源 。 

(二 ) 研究 团队 介绍 

研究 团队 包括 申请 人 及 项 目 组 成 员 。 介 绍 内 容 包括 申请 人 情况 及 主要 成 员 情况 。 如 申请 
人 的 学 历 、 职 称 、 从 事 研究 和 科研 训练 经 历 、 主 要 研究 方向 , 与 本 题 相关 的 研究 工作 和 课题 ( 特 
别 要 说 明 本 次 申请 项 目 是 否 为 既往 参加 或 主持 的 研究 工作 的 延续 ), 以 及 与 项 目 有 关 或 者 相关 
的 获奖 和 成 果 , 代表 性 论文 与 级 别 等 。 主 要 成 员 一 般 为 -10 人 ,年龄 .职称 、 人 员 结 构 搭配 要 
合理 ,一 般 有 高 级 研究 人 员 1~2 人 , 中 级 研究 人 员 2~3 人 ,技术 人 员 及 研究 生 3~5 人 。 各 自 所 从 
事 的 工作 衔接 良好 。 描 述 要 切 题 ,与 此 项 目 无 关 的 内 容 要 删除 。 


八 、 医 学 伦理 学 问题 
医学 伦理 学 问题 是 进行 医学 科学 研究 必须 考虑 的 , 应 严格 遵守 《世界 医学 协会 畔 尔 辛 基 宣 
言 义 简称 《赫尔辛基 宣言 》) 和 《 人 体 生物 医学 研究 国际 道德 指南 ) 制 定 的 涉及 人 体 对象 医 学 研 
究 的 道德 原则 ,包括 以 人 作为 受 试 对 象 的 生物 医学 研究 的 伦理 原则 和 限制 条 件 , 人 体 生物 医学 
研究 政策 和 伦理 标准 以 及 已 确立 的 伦理 审查 机 制 等 。 


九 . 经 费 预 算 
科研 经 费 是 进行 科研 活动 的 基本 保障 。 应 按照 相关 规定 , 本 着 实事 求 是 、 精 打 细 算 的 原则 ， 


编制 切合 实际 的 项 目 经 费 预 算 。 项 目 资助 经 费 预算 包括 收入 预算 与 支出 预算 。 收 入 预算 包括 
用 于 项 目 人 研究 的 各 种 不 同 渠道 的 经 费 , 如 从 自然 科学 基金 获得 的 资助 .从 项 目 依托 单位 获得 的 
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资助 和 从 其 他 渠道 获得 的 资助 等 。 支 出 预算 包括 研究 经 费 、 国 际 合作 与 交流 经 费 、 劳 务 费 和 管 
理 费 。 在 项 目 申请 时 , 支出 预算 要 详尽 合理 列 出 , 一 般 依据 以 下 几 个 方面 进行 预算 : 

(一 ) 研究 经 费 

研究 经 费 是 指 直接 用 于 科学 研究 的 费用 , 是 经 费 预 算 的 重点 , 占 申请 经 费 的 80% 左右 , 包 
括 科 研 业 务 费 .实验 材料 费 、 仪 器 设备 费 、 实 验 室 改 装 费 、 协 作 费 等 。 科 研 业 务 费 含 测试 计算、 
分 析 费 . 差旅费 、 调 研 和 学 术 会 议 费 、 论 文 版 面 费 和 资料 印刷 费 , 以 及 文献 检索 、 入 网 等 信息 通 
信 费 材料 费 含 原材料 试剂 .药品 等 消耗 品 购置 费 , 实验 动物 、 标 本 、 样 品 的 采集 加 工 费 
和 包装 运输 费 等 ; 仪器 设备 费 包括 专用 仪器 设备 购置 运输、 安装 费 和 修理 费 , 自制 专用 仪器 设 
备 的 材料 、 配 件 购置 费 和 加 工 费 ; 实验 室 改装 费 为 改善 资助 项 目 研究 的 实验 条 件 , 对 实验 室 进 
行 改装 所 开支 的 费用 ; 协作 费 为 外 单位 协作 承担 项 目 部 分 研究 试验 工作 的 费用 。 

(二 ) 国际 合作 与 交流 经 费 

国际 合作 与 交流 经 费 是 指 用 于 与 资助 项 目 研究 工作 有 直接 关系 的 国际 合作 与 交流 费用 , 包 
括 项 目 组 人 员 出访 及 外 国 专家 来 访 的 部 分 费用 。 一 般 小 额度 的 资助 项 目 无 此 项 预算 。 

(三 ) 劳务 费 

劳务 费 是 指 用 于 直接 参加 项 目 研究 的 学 生 的 劳务 费用 。 一 般 不 得 超过 资助 经 费 的 10%~15%。 

(四 ) 管理 费 

管理 费 是 指 项 目 依托 单位 为 组 织 和 支持 项 目 研究 而 支出 的 费用 , 包括 项 目 执行 中 公用 仪器 
设备 、 房 屋 占用 费 等 。 一 般 管 理 费 不 得 超过 资助 经 费 的 5%。 

所 有 项 目 支出 计算 应 该 分 配合 理 , 逐一 列 出 , 写 明 计算 依据 。 仪 器 设备 费 , 实验 室 改装 费 
尽量 少 填 , 最 好 不 填 , 不 然 会 给 人 造成 研究 条 件 尚 不 具备 的 印象 。 


十 、 对 照 检查 提纲 


一 份 项 目 申请 书 初稿 撰写 完毕 ,要 反复 审慎 地 审查 、 修 改 、 再 审查 、 再 修改 , 项 目 组 成 员 要 
多 次 讨论 , 直至 认为 基本 没有 什么 纶 漏 后 , 可 请 相关 专家 学 者 审阅 , 提出 批评 建议 , 也 可 请 从 未 
涉足 申请 项 目 相 关 问 题 研究 的 老师 和 同学 审阅 , 以 评价 所 申报 项 目 立论 依据 是 否 充分 , 研究 目 
标 是 否 明确 , 假设 是 否 合理 , 研究 内 容 是 否 玮 绕 研究 目标 进行 , 方案 合理 可 行 否 , 项 目的 特色 及 
创新 性 怎样 ,以 下 几 点 列 出 临床 科研 设计 的 检查 提纲 , 可 供 参 考 : 

1. 课题 研究 的 意义 是 否 阐释 清楚 ,是 否 为 重要 领域 的 重要 问题 ,是 否 具有 重要 的 理论 价值 
或 应 用 前 景 。 

2. 国内 外 目前 的 研究 现状 怎样 ,了 解 的 广度 和 深度 如 何 , 近 5 年 的 主要 研究 进展 是 否 竺 
担 , 是 否 介 绍 了 目前 研究 存在 的 主要 问题 , 以 此 提出 所 申请 项 目的 切入 点 , 进一步 形成 研究 目 
标 及 思路 。 

3. 项 目 特色 及 创新 性 体现 在 哪 方面 ,是 否 可 能 形成 新 的 学 说 或 理论 , 是 否 产生 新 的 方法 与 
技术 ,或 改进 及 完善 了 以 往 的 技术 。 

4. 尽 可 能 引用 国内 外 近 3~5 年 的 参考 文献 。 

5. 研究 目标 是 和 否 能 够 实现 , 是 否 目标 过 大 或 过 于 局 限 。 

6. 研究 内 容 范 围 是 否 合适 , 一 般 列 出 3~5 个 研究 内 容 , 要 有 1~2 个 突出 的 重点 , 把握 1~2 
个 关键 问题 。 

7. 研究 方案 设计 是 否 合理 ,研究 变量 选择 是 否 合理 , 研究 对 象 纳入 排除 标准 是 否 明确 , 样 
本 量 是 否 足 够 , 方法 与 技术 是 否 成 熟 可 靠 、 可 重复 性 强 、 易 于 掌握 。 

8.， 与 本 项 目 有 关 的 工作 积累 有 哪些 , 有 无 已 发 表 的 相关 研究 论文 和 工作 基础 , 预 实验 的 结 
果 如 何以 及 是 否 建立 了 实验 模型 。 
































第 十 六 章 ”临床 医学 研究 项 目 申报 书 的 撰写 


TSER 


9. 开展 研究 的 条 件 是 否 具备 , 主要 仪器 和 设备 是 否 到 位 , 病例 的 积累 是 否 足够 等 。 
10. 项 目 组 成 员 结构 是 否 合理 : 主要 成 员 组 成 是 否 合理 , 高、 中 级 研究 人 员 , 技术 人 员 以 及 
学 生 的 搭配 比例 如 何 。 注 意 大 学 生 创新 项 目的 主要 成 员 应 为 在 校 的 大 学 生 。 


( 王 袁 萍 ) 
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附 表 ”随机 数字 表 
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48 |27|62|50|96|72|79|144|61|40|15| | 40|65| 39127|31|58|50|28| 11 | 39| 03 | 34 | 25 
49 |33|78|80|87|15|38|30 06| 38 21|14|47|147|oz|26154|9%6| 87| 53|32| 40|36|40|96|76 


50 |13|113|12|66|991|147|124|149157|174132125|143|62117110|9%7111 69| 84 99 | 63 | 22 | 32 | 98 
摘自 Fisher RA, Yates F. Statistical Tables for Biological ， Agricultural and Medical Research. Oliver and Boyd, 1957: 128 
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